首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于状态预测的多智能体自协调协作模型设计

摘要第1-4页
ABSTRACT第4-8页
第一章 绪论第8-18页
   ·研究背景与研究意义第8页
   ·国内外研究现状第8-11页
   ·救援机器人系统第11-16页
     ·RoboCupRescue救援机器人比赛第11-13页
     ·救援机器人仿真比赛系统第13-16页
   ·论文主要内容及构成第16-18页
第二章 自协调协作模型总体结构第18-32页
   ·协作的目的第18页
   ·自协调协作模型设计要求第18-19页
   ·几种常见的Multi-Agent体系结构第19-22页
   ·RoboCupRescue系统中主要面临的协作问题第22-23页
   ·状态预测问题的提出第23-24页
   ·基于状态预测的多智能体自协调模型结构第24-25页
   ·中央决策层强化学习算法选择第25-30页
     ·强化学习概念和原理第25-26页
     ·强化学习系统的组成要素第26-28页
     ·强化学习分类第28-30页
   ·本章小结第30-32页
第三章 基于强化学习的状态预测方法设计第32-47页
   ·RoboCupRescue系统的世界模型及对状态预测的影响第32-35页
     ·RoboCupRescue系统的世界模型第32-33页
     ·世界模型对基于强化学习的状态预测的影响第33-35页
   ·针对状态预测的Q学习算法设计第35-39页
     ·Q学习算法改进问题的提出第35-36页
     ·Q学习算法的改进第36-39页
   ·基于改进 Q学习的世界模型状态预测方法设计第39-46页
     ·世界模型(状态空间)的建立第39-43页
     ·世界模型(动作空间)的建立第43-44页
     ·预测状态空间的建立第44页
     ·奖赏函数的设计第44-45页
     ·预测状态的选择策略第45-46页
     ·学习更新第46页
   ·本章小结第46-47页
第四章 基于状态预测的多Agent自协调模型设计第47-61页
   ·决策方式第47页
   ·基于状态预测和改进Q学习的阵型决策设计第47-53页
     ·针对阵型决策的Q学习算法改进第47-49页
     ·阵型决策方法设计第49-53页
   ·行为层设计第53-60页
     ·反应式策略第54页
     ·Agent行为效用评估第54-56页
     ·基于改进栅格法的Agent路径规划蚁群算法设计第56-60页
   ·本章小结第60-61页
第五章 软件设计及仿真分析第61-70页
   ·软件设计目标第61页
   ·软件设计第61-63页
   ·仿真实验与分析第63-69页
     ·仿真环境介绍第63-65页
     ·仿真实验内容与设置第65-66页
     ·仿真结果分析第66-69页
   ·本章小结第69-70页
第六章 结论与展望第70-72页
   ·结论第70-71页
   ·展望第71-72页
参考文献第72-77页
致谢第77-78页
攻读学位期间主要的研究成果第78页

论文共78页,点击 下载论文
上一篇:基于粗糙集的铅锌熔炼过程不完备信息智能处理方法及应用
下一篇:多温区测控系统的自适应PSD算法研究