首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文--智能机器人论文

自主移动机器人导航与控制中的增强学习方法研究

表目录第1-7页
图目录第7-8页
摘要第8-9页
ABSTRACT第9-11页
第一章 绪论第11-21页
   ·自主移动机器人导航与控制第11-15页
     ·自主移动机器人导航与控制概述第11-12页
     ·自主移动机器人导航与控制关键技术第12-15页
     ·发展趋势分析第15页
   ·增强学习的研究现状与发展趋势第15-19页
     ·增强学习理论研究概况第15-16页
     ·增强学习算法的研究进展第16-18页
     ·应用与发展趋势第18-19页
   ·本文主要工作第19-21页
第二章 近似策略迭代及其参数优化方法研究第21-46页
   ·Markov 决策过程与近似策略迭代第21-25页
     ·Markov 链第22页
     ·Markov 决策过程第22-24页
     ·近似策略迭代算法理论框架第24-25页
   ·近似策略迭代算法性能测试与对比分析第25-37页
     ·Q-学习第25-26页
     ·最小二乘策略迭代第26-27页
     ·基于核的最小二乘策略迭代第27-31页
     ·近似策略迭代算法性能评估第31-37页
   ·KLSPI 算法中的核函数参数优化方法第37-44页
     ·核函数参数选择的一般方法第38-39页
     ·样本稀疏化第39页
     ·KLSPI 算法中核函数宽度优化第39-42页
     ·仿真实例第42-44页
   ·本章小结第44-46页
第三章 基于近似策略迭代的移动机器人自主避障控制第46-57页
   ·移动机器人系统及自主避障过程建模第46-48页
     ·移动机器人系统及仿真环境第46-47页
     ·移动机器人避障行为决策过程MDP 建模第47-48页
   ·基于近似策略迭代的移动机器人自主避障方法第48-50页
     ·滚动窗口路径规划方法第48-49页
     ·基于近似策略迭代的反应式导航控制方法第49-50页
   ·基于近似策略迭代的自主避障控制方法实验第50-56页
     ·基于LSPI 的自主避障控制方法仿真第50-53页
     ·基于KLSPI 的自主避障控制方法仿真第53-55页
     ·两种自主避障方法性能对比第55-56页
   ·本章小结第56-57页
第四章 近似策略迭代在自主车辆速度学习控制中的应用第57-68页
   ·高速公路环境下自主驾驶车辆的发展现状和趋势第57-59页
     ·高速公路环境下自主驾驶车辆的研究现状第57-58页
     ·自主驾驶车辆的增强学习控制方法研究概况第58-59页
   ·自主驾驶车辆的动力学建模和运动控制过程MDP 建模第59-62页
     ·车辆动力学建模第59-62页
     ·自主驾驶车辆运动控制过程MDP 建模第62页
   ·车辆纵向速度的近似策略迭代学习控制方法仿真第62-67页
     ·仿真平台设计第62-63页
     ·基于LSPI 的纵向速度学习控制方法及仿真第63-66页
     ·基于KLSPI 的纵向速度学习控制方法及仿真第66-67页
   ·本章小结第67-68页
第五章 总结和展望第68-70页
   ·本文工作总结第68页
   ·工作展望第68-70页
致谢第70-72页
参考文献第72-80页
作者在学期间取得的学术成果第80-81页
附录A 缩略词对照表第81页

论文共81页,点击 下载论文
上一篇:生物光盘传感器理论分析及初步实验研究
下一篇:超高速数据采集与实时处理系统的设计与实现