首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于强化学习的多机器人任务分配算法研究

提要第1-8页
第一章 绪论第8-18页
   ·问题的提出与研究意义第8-9页
   ·多机器人系统研究现状及存在的问题第9-11页
     ·国内外研究现状第9-10页
     ·存在的问题第10-11页
   ·多机器人任务分配算法第11-14页
     ·集中式任务分配算法第11-12页
     ·分布式任务分配算法第12-14页
   ·工程应用第14-15页
   ·论文主要研究内容第15-18页
第二章 基于市场机制的多机器人任务分配算法第18-32页
   ·引言第18-19页
   ·任务模型建立第19-22页
     ·任务特征项第20页
     ·任务参数设置第20-21页
     ·机器人状态的转换第21-22页
     ·任务评价函数设计第22页
   ·任务分配算法设计第22-24页
     ·市场机制分配算法第22-23页
     ·动态出价公式设计第23-24页
   ·实验结果及分析第24-30页
   ·小结第30-32页
第三章 基于强化学习的多机器人任务分配算法第32-48页
   ·引言第32-34页
   ·强化学习的基本理论第34-36页
     ·马尔可夫决策过程第34页
     ·强化学习的基本组成第34-36页
   ·强化学习的主要算法第36-38页
     ·动态规划方法第36页
     ·瞬时差分法第36-37页
     ·Q-学习第37-38页
     ·蒙特卡罗算法第38页
   ·基于强化学习的任务分配算法第38-41页
     ·无协作任务学习算法第38-41页
     ·有协作任务学习算法第41页
   ·实验结果及分析第41-47页
     ·无协作任务学习算法实验第41-44页
     ·有协作任务学习算法实验第44-46页
     ·实验结果分析第46-47页
   ·小结第47-48页
第四章 群体机器人集群行为控制算法第48-60页
   ·引言第48-49页
   ·自然界生物自组织现象第49-51页
     ·蚂蚁第49-50页
     ·大雁第50-51页
   ·VICSEK 模型以及 BOID 模型第51-53页
   ·VICSEK 模型在群体机器人自组织行为中的应用第53-57页
     ·方向趋同模块第53页
     ·避碰模块第53-55页
     ·聚集模块第55-56页
     ·策略加权第56-57页
   ·实验结果及分析第57-59页
   ·小结第59-60页
第五章 多机器人仿真系统第60-68页
   ·引言第60-61页
   ·仿真系统的构成第61-64页
     ·仿真系统的硬件结构第61-63页
     ·仿真系统的软件结构第63-64页
   ·仿真系统的关键技术第64-67页
     ·多机器人救火任务模块设计第64-66页
     ·强化学习模块设计第66-67页
   ·小结第67-68页
第六章 全文总结第68-70页
   ·本文完成的主要工作及结论第68-69页
   ·需要进一步研究的问题第69-70页
参考文献第70-73页
摘要第73-76页
ABSTRACT第76-80页
致谢第80-81页
导师与作者简介第81页

论文共81页,点击 下载论文
上一篇:机器人辅助微创手术视觉导航定位系统研究
下一篇:智能车灯控制系统的设计及其控制策略研究