摘要 | 第1-6页 |
Abstract | 第6-12页 |
1 绪论 | 第12-26页 |
·课题的背景和意义 | 第12-23页 |
·多机器人路径规划关键技术的研究意义与典型应用 | 第13-14页 |
·多机器人路径规划关键技术的发展 | 第14页 |
·多机器人路径规划的控制体系结构 | 第14-17页 |
·多机器人路径规划 | 第17-20页 |
·多机器人强化学习 | 第20-22页 |
·多机器人系统行为控制 | 第22-23页 |
·学习分类器理论和算法的发展 | 第23-24页 |
·学习分类器发展及应用现状 | 第23页 |
·基于强度的学习分类器 | 第23-24页 |
·基于精度的学习分类器 | 第24页 |
·本文研究工作主要创新点 | 第24页 |
·本文的内容安排 | 第24-26页 |
2 基于学习分类器的多机器人路径规划控制体系结构 | 第26-36页 |
·引言 | 第26-27页 |
·多机器人混合分层体系结构 | 第27-29页 |
·多机器人系统的传统体系结构 | 第27-28页 |
·多机器人混合分层体系结构 | 第28页 |
·学习分类器系统 | 第28-29页 |
·基于学习分类器的多机器人路径规划控制体系结构设计 | 第29-34页 |
·基本思想 | 第30页 |
·协作规划层 | 第30-33页 |
·协调规划层 | 第33页 |
·行为控制层 | 第33-34页 |
·基于学习分类器的多机器人路径规划控制体系结构通讯方式 | 第34-35页 |
·本章小结 | 第35-36页 |
3 基于梯度下降法的学习分类器在多机器人强化学习中的应用 | 第36-48页 |
·引言 | 第36页 |
·强化学习相关技术 | 第36-39页 |
·强化学习 | 第37-38页 |
·梯度下降法Q学习 | 第38-39页 |
·学习分类器相关技术 | 第39-41页 |
·基于梯度下降Q学习的XCS设计 | 第41-43页 |
·Q(s_(t+1),a_(t+1))到 XCS的映射 | 第41-42页 |
·权值w到XCS的映射 | 第42页 |
·梯度下降的强化机制 | 第42页 |
·机器人编码设计和Q表格 | 第42-43页 |
·仿真实验和分析 | 第43-47页 |
·实验场景一 25个栅格的小环境地图 | 第44页 |
·实验场景二 数字5组成的"5"字迷宫 | 第44-46页 |
·实验场景三 数字6组成的"6"字迷宫 | 第46-47页 |
·本章小结 | 第47-48页 |
4 基于多LCS和人工势场法的多机器人行为控制 | 第48-60页 |
·引言 | 第48页 |
·相关技术原理 | 第48-55页 |
·基于多LCS的移动机器人行为控制系统 | 第48-49页 |
·基于人工势场法的机器人行为 | 第49-52页 |
·学习分类器技术相关技术 | 第52-55页 |
·基于多LCS的移动机器人行为控制 | 第55-56页 |
·规则编码 | 第55页 |
·基于LCS的行为控制适应度函数设计 | 第55-56页 |
·规则覆盖算法的几种增强算法 | 第56页 |
·仿真实验和分析 | 第56-59页 |
·本章小结 | 第59-60页 |
5 基于学习分类器的多机器人在未知狭隘环境下的路径规划 | 第60-80页 |
·前言 | 第60页 |
·相关技术原理 | 第60-64页 |
·学习分类器系统 | 第60-61页 |
·改进学习分类器系统 | 第61-62页 |
·多机器人系统最优规则产生流程 | 第62-64页 |
·基于学习分类器的遗传算法设计 | 第64-71页 |
·基于学习分类器的多机器人路径规划优化模型 | 第64页 |
·规则编码 | 第64-65页 |
·静态狭隘环境下的遗传算法适应度函数 | 第65-67页 |
·动态狭隘环境下的遗传算法适应度函数设计 | 第67-68页 |
·遗传算子策略 | 第68-69页 |
·基于LCS的信用分配算法收敛性分析 | 第69-70页 |
·学习分类器信用分配算法参数调整 | 第70-71页 |
·仿真实验 | 第71-79页 |
·实验场景一、在狭隘环境下的单机器人仿真 | 第73-76页 |
·实验场景二、在狭隘环境下的多机器人仿真 | 第76-78页 |
·实验结果分析 | 第78-79页 |
·本章小结 | 第79-80页 |
6 基于XCS和LS-SVM的多机器人在狭隘环境中的避碰规划 | 第80-97页 |
·引言 | 第80页 |
·相关技术原理 | 第80-83页 |
·学习分类器 | 第80-82页 |
·最小二乘支持向量机的Q学习 | 第82-83页 |
·基于XCS的多机器人路径规划冲突解决方案 | 第83-90页 |
·多机器人学习训练方法 | 第83-87页 |
·机器人优先级别设计 | 第87-88页 |
·多机器人协商行为设计 | 第88页 |
·多机器人路径冲突等级策略的集成适应度函数 | 第88-89页 |
·遗传算子的设计与改进 | 第89-90页 |
·基于XCS和LS-SVM的多机器人避碰规划策略 | 第90页 |
·仿真实验 | 第90-96页 |
·实验场景一、存在U型障碍物的动态狭隘环境 | 第91-92页 |
·实验场景二、存在狭窄通道的多障碍物动态狭隘环境 | 第92-93页 |
·实验场景三、存在凸凹多障碍物的动态狭隘环境 | 第93-95页 |
·实验结果分析 | 第95-96页 |
·本章小结 | 第96-97页 |
7 总结和展望 | 第97-99页 |
·本文工作总结 | 第97页 |
·未来研究方向展望 | 第97-99页 |
·环境感知技术 | 第98页 |
·多传感器信息融合技术 | 第98页 |
·学习分类器技术 | 第98页 |
·多机器人行为的自主学习研究 | 第98-99页 |
致谢 | 第99-100页 |
参考文献 | 第100-111页 |
附录 | 第111-112页 |