首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于CE-Q强化学习与K-means聚类混合算法的多机器人觅食任务研究

目录第1-7页
摘要第7-8页
Abstract第8-10页
附图索引第10-11页
附表索引第11-12页
第一章 绪论第12-18页
   ·Multi-agent系统的研究背景第12-15页
   ·强化学习方法的发展现状及趋势第15-16页
   ·本文研究内容第16-18页
第二章 Agent的结构与通信协调技术第18-30页
   ·Agent的基本概念第18-19页
   ·Agent的硬件构造第19-20页
   ·Agent的结构及通信第20-27页
     ·Agent的结构第20-24页
     ·Agent通信的类型与方式第24-27页
   ·多Agent的协作、协商与协调技术第27-28页
   ·本章小结第28-30页
第三章 基于博弈论框架的强化学习算法第30-43页
   ·Multi-agent系统的Q强化学习算法第30-32页
   ·SGs框架下的Multi-agent系统强化学习算法第32-37页
     ·Minimax-Q强化学习算法第33页
     ·Nash-Q学习算法第33-34页
     ·FF-Q(Friend-or-Foe Q)强化学习算法第34-35页
     ·Correlated Equilibrium-Q强化学习算法第35-36页
     ·Pareto-Q学习算法第36页
     ·MetaQ及AWESOME学习算法第36-37页
     ·总结第37页
   ·Multi-agent系统的冲突消解策略第37-41页
     ·手工编程的冲突消解策略第38-41页
     ·基于强化学习的冲突消解策略第41页
   ·本章小结第41-43页
第四章 基于动作过程指导的改进CE-Q算法及其在觅食任务中的应用第43-50页
   ·觅食任务介绍第43-45页
     ·觅食任务描述第43-45页
     ·觅食任务中Agent的行为描述第45页
   ·基于动作过程指导的改进CE-Q算法第45-46页
   ·仿真实验验证第46-49页
     ·仿真实验平台构建第46-47页
     ·仿真实验过程第47-48页
     ·仿真实验结果及分析第48-49页
   ·本章小结第49-50页
第五章 基于K-Means聚类算法的强化学习及其在觅食任务中的应用第50-57页
   ·K-Means聚类算法在强化学习中的应用第50-52页
     ·聚类算法简介第50-51页
     ·K-Means聚类算法第51-52页
   ·基于K-Means的觅食任务研究第52-55页
   ·仿真实验与结论第55-56页
     ·仿真实验过程及结果第55-56页
     ·仿真实验分析及结论第56页
   ·本章小结第56-57页
结论与展望第57-58页
参考文献第58-61页
致谢第61-62页
附录A第62-63页
附录B 仿真实验程序第63-74页

论文共74页,点击 下载论文
上一篇:基于改进TANC的机器学习文本分类方法研究
下一篇:基于神经网络的微网逆变器控制策略研究