首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--在其他方面的应用论文

基于信度分配的多智能体强化学习研究

摘要第1-6页
ABSTRACT第6-10页
第一章 概述第10-27页
   ·引言第10页
   ·人工智能的发展历史第10-12页
   ·多智能体强化学习的研究意义及其系统特点第12-14页
     ·研究意义第13-14页
     ·系统特点第14页
   ·强化学习研究现状第14-19页
   ·多智能体学习研究现状第19-24页
     ·多智能体学习系统基本概念第19-22页
     ·多智能体学习研究内容第22-24页
   ·多智能体强化学习研究现状第24-27页
     ·多智能体强化学习基础第24-25页
     ·多智能体强化学习思想第25-27页
   ·本文研究内容与结构安排第27页
     ·研究内容第27页
     ·结构安排第27页
第二章 多智能体强化学习方法第27-42页
   ·引言第28页
   ·强化学习方法研究第28-32页
     ·TD 算法第29-30页
     ·Dyna 算法第30页
     ·Q 学习第30-32页
     ·强化学习研究热点问题第32页
   ·多智能体学习方法研究第32-35页
     ·算法特点第34页
     ·异质多智能体系统中结构角色的学习第34页
     ·协调学习策略第34-35页
   ·多智能体强化学习方法研究第35-41页
     ·强化学习的原理第35-36页
     ·对策论基础第36-39页
     ·多智能体强化学习算法第39-41页
   ·本章小结第41-42页
第三章 基于信度分配的多智能体强化学习第42-58页
   ·引言第42页
   ·协作型多智能体强化学习第42-45页
   ·协作工作基本思想第45-49页
   ·强化信号的信度分配第49-51页
   ·基于信度分配的多智能体强化学习算法第51-55页
   ·算法过程和算法流程图第55-56页
   ·本章小结第56-58页
第四章 实例分析与仿真验证第58-72页
   ·实例分析第58-62页
     ·追逐对策问题描述第59-60页
     ·算法流程第60-62页
   ·仿真验证第62-71页
     ·设计思想第63-66页
     ·实验结果第66-71页
   ·本章小结第71-72页
第五章 总结与展望第72-74页
   ·对本文工作的总结第72页
   ·对下一步工作的展望第72-74页
参考文献第74-78页
附录A(攻读学位期间发表论文目录)第78-79页
附录B(实例化编程源代码)第79-88页

论文共88页,点击 下载论文
上一篇:双三角翼上分离及多涡流特性研究
下一篇:解放战争时期党的思想政治工作研究