多机器人协作的学习与进化方法
摘要 | 第1-5页 |
ABSTRACT | 第5-10页 |
第1章 序言 | 第10-14页 |
1.1 研究背景 | 第10-11页 |
1.2 研究目的和方法 | 第11-12页 |
1.3 主要研究结果 | 第12页 |
1.4 论文结构 | 第12-13页 |
参考文献 | 第13-14页 |
第2章 多机器人协作的研究内容与方法 | 第14-30页 |
2.1 引言 | 第14页 |
2.2 多机器人协作与协调 | 第14-16页 |
2.3 多机器人协作的分类 | 第16-18页 |
2.4 多机器人协作的主要研究内容与进展 | 第18-21页 |
2.5 多机器人协作的主要研究方法 | 第21-23页 |
2.6 小结 | 第23页 |
参考文献 | 第23-30页 |
第3章 多机器人协作的进化方法 | 第30-46页 |
3.1 引言 | 第30页 |
3.2 机器人行为的进化 | 第30-36页 |
3.3 多机器人行为的协进化 | 第36-38页 |
3.4 小结 | 第38页 |
参考文献 | 第38-46页 |
第4章 多机器人协作的学习方法 | 第46-56页 |
4.1 引言 | 第46页 |
4.2 强化学习 | 第46-51页 |
4.3 强化学习在多机器人研究中的应用 | 第51-52页 |
4.4 小结 | 第52页 |
参考文献 | 第52-56页 |
第5章 多机器人协作仿真环境设计与开发 | 第56-66页 |
5.1 引言 | 第56页 |
5.2 多机器人协作仿真环境的功能 | 第56-57页 |
5.3 系统的结构与运行流程 | 第57-61页 |
5.4 仿真环境的用户界面 | 第61-64页 |
5.5 结束语 | 第64页 |
参考文献 | 第64-66页 |
第6章 多机器人协作的分层学习方法 | 第66-82页 |
6.1 引言 | 第66-67页 |
6.2 多机器人系统的协作任务和结构 | 第67-69页 |
6.3 两层强化学习算法 | 第69-73页 |
6.4 多机器人协作的仿真实验 | 第73-76页 |
6.5 实验结果与分析 | 第76-79页 |
6.6 小结 | 第79-80页 |
参考文献 | 第80-82页 |
第7章 多机器人协作的状态预测学习方法 | 第82-94页 |
7.1 引言 | 第82页 |
7.2 状态预测 | 第82-84页 |
7.3 基于状态预测的强化学习 | 第84-86页 |
7.4 多机器人协作的状态预测强化学习 | 第86-87页 |
7.5 实验结果与分析 | 第87-91页 |
7.6 小结 | 第91-92页 |
参考文献 | 第92-94页 |
第8章 多机器人协作的协进化方法 | 第94-108页 |
8.1 引言 | 第94页 |
8.2 协进化化方法 | 第94-95页 |
8.3 多机器人协作搬运任务 | 第95-97页 |
8.4 多机器人协作搬运协进化设计 | 第97-99页 |
8.5 任务分解与进化种群设计 | 第99-102页 |
8.6 仿真实验结果 | 第102-105页 |
8.7 小结 | 第105页 |
参考文献 | 第105-108页 |
第9章 多机器人协作中机器人的局部导航 | 第108-118页 |
9.1 引言 | 第108页 |
9.2 势能场方法及问题 | 第108-110页 |
9.3 一种改进势能场方法 | 第110-113页 |
9.4 改进方法的实现与实验 | 第113-116页 |
9.5 结论 | 第116页 |
参考文献 | 第116-118页 |
第10章 结束语 | 第118-120页 |
致谢 | 第120-121页 |
作者在攻读博士学位期间发表和完成的论文 | 第121页 |