首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

Q-learning研究及其在AUV局部路径规划中的应用

第1章 绪论第1-17页
   ·水下机器人概述第10-11页
   ·移动机器人路径规划第11-13页
     ·路径规划问题的分类第11页
     ·常用路径规划方法介绍第11-12页
     ·墙角问题的解决方法第12-13页
   ·水下机器人局部路径规划第13-14页
   ·强化学习理论的典型算法及研究进展第14-15页
   ·本文所做的工作第15-17页
第2章 强化学习的基本理论第17-25页
   ·学习的分类第17-18页
   ·强化学习的定义及分类第18-20页
     ·强化学习的定义第18-19页
     ·强化学习的特点第19页
     ·强化学习的分类第19-20页
   ·强化学习系统的结构模型第20-21页
   ·输入模块的实现方法第21-22页
     ·BOX结构方法第22页
     ·模糊方法第22页
     ·神经网络方法第22页
   ·强化学习的目标和强化模块的实现方法第22-23页
   ·动作选择模块的实现第23-24页
   ·本章小结第24-25页
第3章 Q-学习及算法的改进第25-39页
   ·马尔科夫决策过程第25-26页
     ·马尔科夫性质第25-26页
     ·马尔科夫决策问题的求解第26页
   ·Q-学习的基本算法第26-31页
     ·Q-学习的收敛性第27-28页
     ·Q-学习神经网络实现的结构第28-29页
     ·采用神经网络实现Q-学习算法第29-31页
   ·Q-学习算法的改进第31-37页
     ·Q(λ)算法第32-34页
     ·SARSA(0)算法第34-36页
       ·在策略和离策略算法第34-35页
       ·SARSA(0)算法的收敛性第35-36页
     ·SARSA(λ)算法第36-37页
   ·连续动作的强化学习第37-38页
   ·本章小结第38-39页
第4章 基于CMAC的Q-学习算法第39-45页
   ·CMAC神经网络的结构及基本原理第39-40页
     ·CMAC神经网络的结构第39-40页
     ·CMAC输出层权值的学习方法第40页
   ·CMAC中神经元数目的确定第40-42页
   ·CMAC中虚拟层神经元的地址编码第42-43页
   ·基于CMAC的强化学习算法第43-44页
   ·本章小结第44-45页
第5章 基于强化学习的AUV局部路径规划第45-53页
   ·引言第45页
   ·环境信息的获取第45-47页
     ·传感器的配置及障碍物的探测第46页
     ·水下机器人在某一时刻的状态描述第46-47页
   ·输入输出变量的选取第47-48页
     ·输入状态变量的选取第47-48页
     ·输出状态变量的选取第48页
   ·即时报酬的选取第48-49页
   ·动作选择第49页
   ·基于强化学习的AUV局部路径规划方法第49-52页
   ·本章小结第52-53页
第6章 仿真实验第53-66页
   ·仿真软件的总体介绍第53-54页
   ·路径规划网络(网络1)的仿真实现第54-58页
     ·网络1的流程图第54-55页
     ·仿真结果及分析第55-58页
   ·沿墙壁行走网络(网络2)的仿真实现第58-59页
   ·复杂环境下水下机器人的路径规划仿真实验第59-63页
     ·程序流程图第59-60页
     ·实验结果第60-63页
   ·强化学习与模糊控制方法在自适应性方面的比较第63-65页
   ·本章小结第65-66页
结论第66-68页
参考文献第68-72页
攻读硕士学位期间发表的论文和取得的科研成果第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:超精密气磁轴承轴系动力学及控制方法的研究
下一篇:城乡一体化小城镇绿地系统研究初探