基于强化学习的移动机器人导航及环境状态探测的研究

1 绪论	第1-15页
·引言	第7-8页
·机器人导航研究现状	第8-10页
·机器人导航方式	第8-9页
·智能方法的应用	第9-10页
·强化学习的研究与应用	第10-13页
·强化学习的发展历史和研究现状	第10-12页
·强化学习应用的研究进展	第12-13页
·机器人视觉的研究概况	第13页
·论文的主要内容及组织结构	第13-15页
2 强化学习理论及算法	第15-24页
·强化学习原理	第15-17页
·强化学习的基本原理和模型	第15-16页
·强化学习的特点	第16-17页
·强化学习系统主要元素	第17-19页
·强化学习的主要算法	第19-21页
·Q学习算法	第21-23页
·Q函数的更新规则	第21-22页
·Q学习算法的步骤	第22页
·Q学习的收敛性	第22-23页
·本章小结	第23-24页
3 基于 Q学习的机器人导航设计及仿真	第24-34页
·强化学习各要素设计	第24-30页
·状态空间和动作空间的表示	第24-26页
·奖赏信号的设计	第26-27页
·动作选择策略	第27-29页
·Q值的实现与学习步骤	第29-30页
·仿真实验	第30-33页
·实验分析	第33页
·本章小结	第33-34页
4 实际环境中目标状态确定	第34-51页
·机器人平台介绍	第34-36页
·基于视觉的目标状态设计	第36-37页
·图象处理的封装及其应用	第37-44页
·图像处理的动态链接库封装	第38-39页
·图像处理应用	第39-44页
·目标识别及其状态确定	第44-50页
·类圆形目标识别方法简介	第45-46页
·一种基于圆形度的目标识别改进方法	第46-50页
·目标状态确定	第50页
·本章小结	第50-51页
5 环境状态探测的实验研究及结果分析	第51-56页
·软件介绍及实验流程	第51-52页
·具体实验及结果分析	第52-55页
·本章小结	第55-56页
6 总结与展望	第56-58页
·全文总结	第56页
·研究工作展望	第56-58页
致谢	第58-59页
参考文献	第59-62页