首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

多智能体协作学习方法的研究

摘要第1-6页
ABSTRACT第6-11页
第一章 绪论第11-18页
   ·研究的背景及意义第11-12页
   ·强化学习概述第12-14页
     ·强化学习的发展历史第12-13页
     ·强化学习的研究现状第13-14页
   ·追捕问题概述第14-16页
     ·追捕问题的发展背景第14-15页
     ·追捕问题的相关研究第15页
     ·追捕问题存在的问题第15-16页
   ·论文研究内容及结构安排第16-18页
     ·研究内容第16页
     ·论文安排第16-18页
第二章 多AGENT 系统第18-24页
   ·AGENT 介绍第18-19页
     ·Agent 的定义第18-19页
     ·Agent 的基本特性第19页
   ·多AGENT 系统概述第19-23页
     ·多Agent 系统的定义及特性第19-20页
     ·多Agent 学习的研究内容第20-22页
     ·多Agent 协作机制第22-23页
   ·本章小结第23-24页
第三章 多AGENT 强化学习理论第24-40页
   ·强化学习第24-35页
     ·强化学习的基本原理和定义第24-25页
     ·马尔可夫决策过程第25-26页
     ·强化学习的基本要素第26-28页
     ·经典的强化学习算法第28-34页
     ·有待进一步研究的问题第34-35页
   ·多AGENT 强化学习第35-39页
     ·MARL 方法及其发展第35-36页
     ·合作MARL第36-37页
     ·基于对策或平衡解的MARL第37-39页
     ·最佳响应MARL第39页
     ·MARL 有待进一步解决的问题第39页
   ·本章小结第39-40页
第四章 改进的多AGENT 协作学习方法第40-49页
   ·多AGENT 的信息共享机制第40-42页
     ·信息共享机制第40-41页
     ·实例分析第41-42页
   ·黑板模型第42-43页
   ·对手状态预测第43-44页
     ·预测技术的提出第43-44页
     ·对手状态预测函数第44页
   ·改进的多AGENT 协作学习算法第44-48页
     ·算法框架第44-45页
     ·算法描述第45-46页
     ·算法说明第46-48页
   ·本章小结第48-49页
第五章 追捕问题研究第49-57页
   ·任务描述第49-50页
   ·追捕流程图第50-51页
   ·算法设计第51-54页
     ·分解目标及确定子目标第51-52页
     ·状态聚类第52页
     ·动作选择策略第52-53页
     ·设定奖赏值第53-54页
     ·更新Q 值第54页
   ·实验结果及其分析第54-56页
   ·本章小结第56-57页
第六章 结论与展望第57-59页
   ·结论第57页
   ·进一步的工作第57-59页
参考文献第59-63页
致谢第63-64页
附录(攻读硕士学位期间发表的论文及参与的科研项目)第64页

论文共64页,点击 下载论文
上一篇:基于群体智能算法的聚类挖掘方法研究
下一篇:基于改进PSO的BP网络的研究及应用