首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文--智能机器人论文

基于强化学习的服务机器人导航研究

摘要第1-5页
Abstract第5-10页
第1章 绪论第10-18页
   ·引言第10页
   ·服务机器人概述第10-13页
     ·服务机器人的定义及应用第10-11页
     ·服务机器人的研究及关键技术第11-13页
   ·课题来源及研究的意义第13-15页
     ·课题的来源第13页
     ·课题研究的目的意义第13-15页
   ·强化学习的发展史及研究现状第15-16页
     ·强化学习的发展史第15-16页
     ·强化学习的研究现状第16页
   ·本文的主要内容和组织结构第16-18页
第2章 强化学习的基础理论第18-28页
   ·引言第18页
   ·强化学习模型第18-20页
     ·马尔可夫决策过程第18-19页
     ·强化学习的基本原理第19-20页
   ·强化学习系统的组成元素第20-23页
     ·强化学习四要素第20-21页
     ·状态值函数第21-23页
   ·探索和利用的平衡第23-24页
   ·Q 学习第24-26页
     ·Q 学习的基本算法第24-25页
     ·Q 学习的实现方法第25-26页
     ·Q 学习的主要步骤第26页
   ·本章小结第26-28页
第3章 基于强化学习的反应式导航研究第28-39页
   ·引言第28页
   ·机器人强化学习系统设计第28-32页
     ·机器人模型第28-29页
     ·环境状态的划分第29-30页
     ·机器人行为动作的定义第30-31页
     ·奖赏回报函数的设定第31-32页
   ·动作选择机制第32-33页
   ·资格迹—Q 学习算法第33-34页
   ·基于强化学习的反应式导航步骤第34-35页
   ·仿真实验结果及分析第35-37页
   ·本章小结第37-39页
第4章 基于强化学习的静态环境路径规划第39-55页
   ·引言第39页
   ·路径规划第39-40页
     ·栅格(或几何)法第39-40页
     ·拓扑图法第40页
   ·基于强化学习的路径规划第40-49页
     ·地图预处理第41-43页
     ·地图强化学习第43-46页
     ·先验地图学习的流程第46页
     ·路径规划导航第46-48页
     ·路径规划的仿真结果第48-49页
   ·改进的强化学习系统第49-51页
     ·规划路径分析第49页
     ·动作空间和奖赏回报的改进第49-51页
     ·改进后的导航控制仿真结果第51页
   ·轮盘旋转学习策略第51-53页
     ·轮盘旋转策略第51-52页
     ·轮盘旋转学习策略的分析第52-53页
   ·本章小结第53-55页
第5章 基于综合控制的动态环境导航研究第55-65页
   ·引言第55页
   ·基于模糊逻辑的避碰控制第55-59页
     ·模糊控制原理第55-56页
     ·机器人避碰控制规则第56-59页
   ·强化学习路径规划与模糊避障的融合第59-60页
   ·综合导航控制的结构第60页
   ·综合控制下的导航流程第60-62页
   ·基于综合控制的导航仿真结果第62-64页
   ·本章小结第64-65页
结论第65-67页
参考文献第67-72页
致谢第72页

论文共72页,点击 下载论文
上一篇:基于图像处理的油液污染度检测技术的研究
下一篇:基于Agent的国际海运货代系统的设计与实现