基于强化学习的移动机器人导航及环境状态探测的研究
| 1 绪论 | 第1-15页 |
| ·引言 | 第7-8页 |
| ·机器人导航研究现状 | 第8-10页 |
| ·机器人导航方式 | 第8-9页 |
| ·智能方法的应用 | 第9-10页 |
| ·强化学习的研究与应用 | 第10-13页 |
| ·强化学习的发展历史和研究现状 | 第10-12页 |
| ·强化学习应用的研究进展 | 第12-13页 |
| ·机器人视觉的研究概况 | 第13页 |
| ·论文的主要内容及组织结构 | 第13-15页 |
| 2 强化学习理论及算法 | 第15-24页 |
| ·强化学习原理 | 第15-17页 |
| ·强化学习的基本原理和模型 | 第15-16页 |
| ·强化学习的特点 | 第16-17页 |
| ·强化学习系统主要元素 | 第17-19页 |
| ·强化学习的主要算法 | 第19-21页 |
| ·Q学习算法 | 第21-23页 |
| ·Q函数的更新规则 | 第21-22页 |
| ·Q学习算法的步骤 | 第22页 |
| ·Q学习的收敛性 | 第22-23页 |
| ·本章小结 | 第23-24页 |
| 3 基于 Q学习的机器人导航设计及仿真 | 第24-34页 |
| ·强化学习各要素设计 | 第24-30页 |
| ·状态空间和动作空间的表示 | 第24-26页 |
| ·奖赏信号的设计 | 第26-27页 |
| ·动作选择策略 | 第27-29页 |
| ·Q值的实现与学习步骤 | 第29-30页 |
| ·仿真实验 | 第30-33页 |
| ·实验分析 | 第33页 |
| ·本章小结 | 第33-34页 |
| 4 实际环境中目标状态确定 | 第34-51页 |
| ·机器人平台介绍 | 第34-36页 |
| ·基于视觉的目标状态设计 | 第36-37页 |
| ·图象处理的封装及其应用 | 第37-44页 |
| ·图像处理的动态链接库封装 | 第38-39页 |
| ·图像处理应用 | 第39-44页 |
| ·目标识别及其状态确定 | 第44-50页 |
| ·类圆形目标识别方法简介 | 第45-46页 |
| ·一种基于圆形度的目标识别改进方法 | 第46-50页 |
| ·目标状态确定 | 第50页 |
| ·本章小结 | 第50-51页 |
| 5 环境状态探测的实验研究及结果分析 | 第51-56页 |
| ·软件介绍及实验流程 | 第51-52页 |
| ·具体实验及结果分析 | 第52-55页 |
| ·本章小结 | 第55-56页 |
| 6 总结与展望 | 第56-58页 |
| ·全文总结 | 第56页 |
| ·研究工作展望 | 第56-58页 |
| 致谢 | 第58-59页 |
| 参考文献 | 第59-62页 |