基于强化学习和群集智能方法的多机器人协作协调研究
第1章 绪论 | 第1-25页 |
·引言 | 第12页 |
·智能移动机器人研究的问题 | 第12-13页 |
·群体行为概述 | 第13-14页 |
·多机器人系统的研究内容 | 第14-16页 |
·多机器人的主要群体行为 | 第16-22页 |
·本文研究的目的和意义 | 第22页 |
·本文的研究内容 | 第22-23页 |
·本文的组织结构 | 第23-25页 |
第2章 多机器人系统体系结构研究 | 第25-52页 |
·多机器人各种体系结构及其优缺点 | 第25-31页 |
·多机器人系统的传统体系结构 | 第25-26页 |
·基于MAS的多机器人体系结构 | 第26-29页 |
·基于群集智能的多机器人体系结构 | 第29-31页 |
·多机器人系统分层体系结构研究 | 第31-42页 |
·多机器人分层结构 | 第31-32页 |
·面向编队任务的多机器人分层结构实现 | 第32-33页 |
·协作任务层—基于势场栅格法的路径规划算法 | 第33-41页 |
·动作控制层—基于模糊推理的动作规划 | 第41-42页 |
·黑板式通讯 | 第42页 |
·基于群集智能的多机器人意图—行为体系结构研究 | 第42-50页 |
·基于对策论的无通讯协调 | 第42-44页 |
·基于群体智能的低通讯量协调 | 第44-50页 |
·本章小结 | 第50-52页 |
第3章 多机器人系统强化学习算法研究 | 第52-90页 |
·强化学习 | 第52-63页 |
·强化学习的基本原理 | 第52-55页 |
·多智能体强化学习方法 | 第55-63页 |
·多智能体强化学习存在的主要问题 | 第63页 |
·强化学习协调行为层结构 | 第63-65页 |
·多机器人系统强化学习算法的实现 | 第65-81页 |
·应用自组织网络量化压缩状态空间 | 第65-69页 |
·强化学习模块 | 第69-71页 |
·个体行为选择模块 | 第71-72页 |
·群体行为选择模块 | 第72页 |
·强化信号的确定与信度分配问题 | 第72-81页 |
·仿真实验及数据分析 | 第81-89页 |
·仿真实验 | 第82-83页 |
·实验结果分析 | 第83-89页 |
·本章小结 | 第89-90页 |
第4章 多机器人系统群集智能算法研究 | 第90-129页 |
·群集智能介绍 | 第90-102页 |
·人工生命简介 | 第90-91页 |
·人工生命中的群集智能 | 第91-93页 |
·群集智能的基本原则 | 第93-94页 |
·群集智能的主要研究方法 | 第94-100页 |
·群集智能的优缺点 | 第100-102页 |
·多机器人系统群集智能算法实现 | 第102-113页 |
·机器人运动模型 | 第102-103页 |
·避障行为的实现 | 第103-105页 |
·聚集行为的实现 | 第105-108页 |
·排列行为的实现 | 第108-111页 |
·漫游行为的实现 | 第111-113页 |
·群集智能算法稳定性的讨论 | 第113-119页 |
·简化群集模型 | 第113-116页 |
·内聚力分析 | 第116-119页 |
·仿真实验及数据分析 | 第119-123页 |
·仿真实验 | 第119-121页 |
·实验数据分析 | 第121-123页 |
·强化学习算法和群集智能算法的讨论 | 第123-128页 |
·两算法性能讨论 | 第123-126页 |
·信息素传播算法与Q学习算法相似性讨论 | 第126-128页 |
·本章小结 | 第128-129页 |
结论 | 第129-132页 |
参考文献 | 第132-145页 |
攻读博士学位期间发表的论文和取得的科研成果 | 第145-147页 |
致谢 | 第147-148页 |
附录A | 第148-150页 |