首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于强化学习的移动机器人路径规划研究

摘要第1-7页
Abstract第7-10页
第1章 绪论第10-15页
   ·课题背景与意义第10-11页
   ·移动机器人路径技术研究现状第11-12页
   ·强化学习方法研究现状第12-13页
   ·课题的主要工作与内容安排第13-15页
第2章 强化学习理论及算法第15-25页
   ·强化学习原理第15-21页
     ·马尔可夫决策过程第15-16页
     ·强化学习模型与基本要素第16-18页
     ·强化学习的基本算法第18-21页
   ·分层强化学习基本原理第21-24页
     ·半马尔可夫决策过程第21-22页
     ·分层强化学习的最优策略第22页
     ·分层强化学习基本算法第22-24页
   ·本章小结第24-25页
第3章 基于近似动作空间模型的Q-学习算法第25-36页
   ·动作选择策略的主要方法第25-27页
     ·ε-greedy策略第25页
     ·Boltzmann分布策略第25-26页
     ·模拟退火策略第26-27页
   ·基于近似动作模型策略选择的Q-学习算法第27-28页
   ·仿真实验设计第28-30页
     ·环境模型第28-29页
     ·动作空间的表示第29-30页
     ·奖赏函数的设计第30页
     ·动作选择策略第30页
   ·仿真结果与分析第30-35页
   ·本章小结第35-36页
第4章 基于分层强化学习的移动机器人路径规划第36-46页
   ·分层强化学习结构设计第36-37页
   ·移动机器人运动学模型第37-38页
   ·环境信息的获取第38-40页
   ·静态避障模块设计第40-41页
     ·输入和输出状态空间设计第40-41页
     ·奖赏函数的设计第41页
     ·动作选择策略第41页
   ·动态避障模块设计第41-43页
     ·输入和输出状态空间设计第41-42页
     ·奖赏函数的设计第42-43页
   ·仿真实验及结果分析第43-45页
   ·本章小结第45-46页
第5章 移动机器人系统设计及路径规划实验第46-58页
   ·机器人硬件平台第46-47页
     ·Pioneer3-AT机器人第46页
     ·激光扫描测距仪第46-47页
   ·机器人软件框架ROS第47-49页
     ·ROS系统简介第47-48页
     ·ROS系统结构第48-49页
   ·基于ROS与Gazebo的机器人仿真第49-52页
     ·Gazebo简介第49-50页
     ·机器人仿真模型设计第50-52页
   ·实验结果与分析第52-57页
     ·三维仿真实验第52-55页
     ·实物实验第55-57页
   ·本章小结第57-58页
总结与展望第58-59页
致谢第59-60页
参考文献第60-64页
攻读硕士学位期间的论文及科研情况第64页

论文共64页,点击 下载论文
上一篇:移动对象不确定性轨迹预测模型研究
下一篇:基于因子分析法的传媒上市公司财务绩效评价研究