基于强化学习的移动机器人自主学习及导航控制
摘要 | 第1-6页 |
Abstract | 第6-10页 |
插图目录 | 第10-12页 |
算法目录 | 第12-13页 |
第一章 绪论 | 第13-33页 |
·选题的背景和意义 | 第13-14页 |
·移动机器人研究现状 | 第14-25页 |
·移动机器人研究的发展 | 第16-18页 |
·移动机器人导航研究现状 | 第18-22页 |
·机器人学习与知识表示 | 第22-25页 |
·全文内容安排 | 第25-27页 |
参考文献 | 第27-33页 |
第二章 强化学习 | 第33-49页 |
·Markov决策过程与强化学习 | 第33-38页 |
·Markov决策过程 | 第33-34页 |
·强化学习模型与基本要素 | 第34-38页 |
·强化学习基本算法 | 第38-43页 |
·瞬时差分方法 | 第38-41页 |
·Q学习方法 | 第41-43页 |
·分层式强化学习 | 第43-45页 |
·强化学习应用中的关键问题 | 第45-46页 |
·泛化方法 | 第45-46页 |
·探索与利用的权衡 | 第46页 |
·强化函数与算法结构设计 | 第46页 |
·本章小结 | 第46-47页 |
参考文献 | 第47-49页 |
第三章 多超声波传感器信息融合与知识表示 | 第49-77页 |
·多超声波传感器系统信息处理 | 第49-54页 |
·多超声波传感器系统 | 第50-51页 |
·测距信息处理 | 第51-53页 |
·测试结果及分析 | 第53-54页 |
·基于多超声波传感器的目标识别 | 第54-62页 |
·多超声波传感器系统设置 | 第55-56页 |
·目标识别及主动探测算法 | 第56-61页 |
·实验及分析 | 第61-62页 |
·基于灰色系统的智能传感器及信息处理 | 第62-73页 |
·灰色测量系统与灰色传感器 | 第63-66页 |
·感知信息的灰色表示及运算 | 第66-70页 |
·基于灰色系统的多超声波传感器 | 第70-73页 |
·本章小结 | 第73页 |
参考文献 | 第73-77页 |
第四章 基于强化学习的反应式控制 | 第77-107页 |
·反应式控制 | 第77-79页 |
·基于强化学习与模糊逻辑的反应式控制 | 第79-84页 |
·移动机器人模型 | 第79-80页 |
·反应式行为设计 | 第80-83页 |
·仿真实验及结果分析 | 第83-84页 |
·灰色强化学习初探 | 第84-88页 |
·灰色强化学习算法 | 第85-87页 |
·仿真实验及结果分析 | 第87-88页 |
·量子强化学习 | 第88-102页 |
·量子计算方法 | 第89-90页 |
·量子强化学习 | 第90-95页 |
·算法分析及讨论 | 第95-97页 |
·仿真实验及结果分析 | 第97-102页 |
·本章小结 | 第102页 |
参考文献 | 第102-107页 |
第五章 基于分层式强化学习的定性导航 | 第107-125页 |
·栅格—拓扑混合式地图创建 | 第107-111页 |
·栅格地图 | 第108-109页 |
·基于拓扑地图的定性空间构造 | 第109-111页 |
·分层式强化学习的定性空间表示 | 第111-118页 |
·定性代数的形式化框架FAQA | 第112-113页 |
·定性空间强化学习框架 | 第113-116页 |
·分层式强化学习的混合代数表示 | 第116-118页 |
·基于分层式强化学习的定性导航 | 第118-123页 |
·混合式控制体系结构 | 第118-119页 |
·基于拓扑地图的全局规划 | 第119-120页 |
·局部环境的反应式控制 | 第120-121页 |
·仿真实验及结果分析 | 第121-123页 |
·本章小结 | 第123页 |
参考文献 | 第123-125页 |
第六章 移动机器人ATU-II及其导航控制 | 第125-143页 |
·移动机器人平台ATU-II | 第125-136页 |
·整体设计 | 第126-128页 |
·硬件配置 | 第128-134页 |
·软件设计 | 第134-136页 |
·基于强化学习的导航实验研究 | 第136-140页 |
·二阶段学习模式 | 第136-137页 |
·实验结果及其分析 | 第137-140页 |
·本章小结 | 第140-141页 |
参考文献 | 第141-143页 |
第七章 总结与展望 | 第143-147页 |
致谢 | 第147-149页 |
攻读博士学位期间完成的论文 | 第149-150页 |