首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于分层强化学习的移动机器人路径规划

摘要第1-6页
ABSTRACT第6-11页
第1章 绪论第11-21页
   ·移动机器人简介第11页
   ·移动机器人路径规划的意义第11-12页
   ·移动机器人路径规划研究综述第12-14页
   ·路径规划研究现状第14-18页
     ·传统路径规划方法第14-16页
     ·智能路径规划方法第16-18页
   ·目前路径规划发展趋势及存在的问题第18-20页
   ·本文的主要工作第20-21页
第2章 分层强化学习的理论研究第21-35页
   ·引言第21页
   ·强化学习理论基础第21-26页
     ·马尔可夫决策论第21-22页
     ·强化学习的基本思想第22-23页
     ·强化学习的主要算法第23-26页
   ·分层强化学习理论第26-28页
     ·半马尔可夫决策过程第26-27页
     ·分层与抽象第27-28页
     ·分层强化学习基本原理第28页
   ·分层强化学习基本算法第28-34页
     ·Option学习算法第29-31页
     ·HAM学习算法第31-33页
     ·MAXQ学习算法第33-34页
   ·本章小结第34-35页
第3章 分层框架设计及路径规划第35-55页
   ·引言第35-36页
   ·分层强化学习的层框架设计第36-39页
     ·总体层框架第36-37页
     ·决策策略框架第37-38页
     ·三个层次的设计第38-39页
   ·自底向上的学习过程及自顶向下决策过程第39-43页
     ·自底向上的分层强化学习方法第40-42页
     ·自顶向下的决策过程第42页
     ·相关问题讨论第42-43页
   ·路径规划模型设计第43-50页
     ·总体设计第43-44页
     ·机器人传感器模型第44-45页
     ·机器人环境模型第45-46页
     ·层次输入输出变量第46-48页
     ·层次强化信号的选择第48-50页
     ·动作选择策略第50页
   ·机器人的训练仿真第50-54页
     ·静态环境中的训练第51-52页
     ·动态环境中的训练第52-53页
     ·混合环境中的训练第53-54页
   ·本章小结第54-55页
第4章 基于神经网络的分层强化学习改进第55-75页
   ·CMAC神经网络原理第55-58页
     ·CMAC神经网络简介第55-56页
     ·CMAC网络的结构第56-57页
     ·CMAC学习方法第57-58页
   ·基于CMAC改进的Q学习算法第58-62页
     ·改进CMAC的学习算法第58-60页
     ·基于CMAC的Q学习算法改进第60-62页
   ·MAXQ分层强化学习模型与算法第62-67页
     ·分层结构模型第62-64页
     ·评价函数分解结构第64-66页
     ·基于CMAC的MAXQ算法第66-67页
   ·应用于路径规划的MAXQ研究第67-70页
     ·基于MAXQ的路径规划第67-69页
     ·应用于路径规划的MAXQ算法描述第69-70页
   ·两种算法比较第70-74页
     ·静态环境中的算法比较第70-72页
     ·动态环境中的算法比较第72-74页
   ·本章小结第74-75页
第5章 移动机器人的局部路径规划研究第75-90页
   ·引言第75-76页
   ·障碍物模型描述第76-79页
     ·静态障碍物类型第77-78页
     ·动态障碍物类型第78-79页
   ·不同类型障碍物避障方法第79-87页
     ·凸形静态障碍物环境下避障方法第79-81页
     ·凹形障碍物环境下的避障方法以及仿真第81-83页
     ·动态障碍物的避障第83-87页
   ·复杂环境中的路径规划第87-89页
     ·程序流程设计第87-88页
     ·复杂环境中基于不同策略的路径规划实验第88-89页
   ·本章小结第89-90页
结论第90-92页
参考文献第92-97页
攻读硕士学位期间发表的论文和取得的科研成果第97-98页
致谢第98页

论文共98页,点击 下载论文
上一篇:存在之轻--张爱玲小说的存在主义解读
下一篇:烷基萘磺酸盐的开发与研究