提要 | 第1-8页 |
第一章 绪论 | 第8-18页 |
·问题的提出与研究意义 | 第8-9页 |
·多机器人系统研究现状及存在的问题 | 第9-11页 |
·国内外研究现状 | 第9-10页 |
·存在的问题 | 第10-11页 |
·多机器人任务分配算法 | 第11-14页 |
·集中式任务分配算法 | 第11-12页 |
·分布式任务分配算法 | 第12-14页 |
·工程应用 | 第14-15页 |
·论文主要研究内容 | 第15-18页 |
第二章 基于市场机制的多机器人任务分配算法 | 第18-32页 |
·引言 | 第18-19页 |
·任务模型建立 | 第19-22页 |
·任务特征项 | 第20页 |
·任务参数设置 | 第20-21页 |
·机器人状态的转换 | 第21-22页 |
·任务评价函数设计 | 第22页 |
·任务分配算法设计 | 第22-24页 |
·市场机制分配算法 | 第22-23页 |
·动态出价公式设计 | 第23-24页 |
·实验结果及分析 | 第24-30页 |
·小结 | 第30-32页 |
第三章 基于强化学习的多机器人任务分配算法 | 第32-48页 |
·引言 | 第32-34页 |
·强化学习的基本理论 | 第34-36页 |
·马尔可夫决策过程 | 第34页 |
·强化学习的基本组成 | 第34-36页 |
·强化学习的主要算法 | 第36-38页 |
·动态规划方法 | 第36页 |
·瞬时差分法 | 第36-37页 |
·Q-学习 | 第37-38页 |
·蒙特卡罗算法 | 第38页 |
·基于强化学习的任务分配算法 | 第38-41页 |
·无协作任务学习算法 | 第38-41页 |
·有协作任务学习算法 | 第41页 |
·实验结果及分析 | 第41-47页 |
·无协作任务学习算法实验 | 第41-44页 |
·有协作任务学习算法实验 | 第44-46页 |
·实验结果分析 | 第46-47页 |
·小结 | 第47-48页 |
第四章 群体机器人集群行为控制算法 | 第48-60页 |
·引言 | 第48-49页 |
·自然界生物自组织现象 | 第49-51页 |
·蚂蚁 | 第49-50页 |
·大雁 | 第50-51页 |
·VICSEK 模型以及 BOID 模型 | 第51-53页 |
·VICSEK 模型在群体机器人自组织行为中的应用 | 第53-57页 |
·方向趋同模块 | 第53页 |
·避碰模块 | 第53-55页 |
·聚集模块 | 第55-56页 |
·策略加权 | 第56-57页 |
·实验结果及分析 | 第57-59页 |
·小结 | 第59-60页 |
第五章 多机器人仿真系统 | 第60-68页 |
·引言 | 第60-61页 |
·仿真系统的构成 | 第61-64页 |
·仿真系统的硬件结构 | 第61-63页 |
·仿真系统的软件结构 | 第63-64页 |
·仿真系统的关键技术 | 第64-67页 |
·多机器人救火任务模块设计 | 第64-66页 |
·强化学习模块设计 | 第66-67页 |
·小结 | 第67-68页 |
第六章 全文总结 | 第68-70页 |
·本文完成的主要工作及结论 | 第68-69页 |
·需要进一步研究的问题 | 第69-70页 |
参考文献 | 第70-73页 |
摘要 | 第73-76页 |
ABSTRACT | 第76-80页 |
致谢 | 第80-81页 |
导师与作者简介 | 第81页 |