首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于值函数逼近与状态空间分解的增强学习方法研究

摘要第1-10页
Abstract第10-12页
第一章 绪论第12-23页
   ·增强学习概述第12-13页
   ·值函数逼近的研究现状与发展趋势第13-16页
     ·值函数逼近概述第13-14页
     ·基于值函数逼近的增强学习研究现状第14-16页
     ·基于值函数逼近的增强学习发展趋势第16页
   ·结构化增强学习概述与研究现状第16-19页
     ·结构化增强学习概述第16-17页
     ·结构化增强学习研究现状第17-19页
     ·结构化增强学习发展趋势第19页
   ·增强学习在移动机器人导航控制中的应用第19-22页
     ·移动机器人的导航控制第19-20页
     ·增强学习在移动机器人控制中的应用第20-22页
   ·本文主要内容与成果第22-23页
第二章 基于图拉普拉斯算子的近似策略迭代方法研究第23-49页
   ·Markov 决策过程和线性值函数逼近第23-28页
     ·Markov 决策过程(MDP)第24-25页
     ·线性值函数逼近第25-26页
     ·LSPI 算法第26-28页
   ·基于图拉普拉斯算子的值函数逼近第28-32页
     ·MDP 与图拉普拉斯算子第28-30页
     ·RPI 算法中基函数的构建第30-31页
     ·RPI 算法框架第31-32页
   ·基于聚类的RPI 增强学习方法第32-36页
     ·聚类分析第33-34页
     ·基于k-均值聚类的RPI 算法第34-36页
   ·仿真结果与分析第36-43页
     ·仿真问题描述第36-38页
     ·仿真结果与分析第38-43页
   ·倒立摆学习控制实验第43-48页
     ·倒立摆实时控制系统第43-44页
     ·实验结果第44-48页
   ·本章小结第48-49页
第三章 基于状态空间分解的结构化增强学习方法研究第49-63页
   ·结构化增强学习概述第49-54页
     ·SMDP 与结构化增强学习第49-51页
     ·结构化增强学习典型算法第51-54页
   ·基于RPI 的结构化增强学习算法第54-59页
     ·基于值函数的二叉树状态空间分解第54-56页
     ·基于RPI 的结构化增强学习算法描述第56-59页
   ·仿真结果与分析第59-62页
     ·仿真设计第59页
     ·仿真结果第59-62页
   ·本章小结第62-63页
第四章 基于增强学习的移动机器人自主避障控制第63-73页
   ·移动机器人自主避障控制第63-66页
     ·移动机器人自主避障导航控制第63-65页
     ·移动机器人的自主避障问题建模第65-66页
   ·基于RPI 算法的自主避障方法第66-67页
     ·滚动窗口路径规划方法第66页
     ·基于改进RPI 算法的反应式导航控制方法第66-67页
   ·基于改进RPI 算法的自主避障实验第67-71页
     ·基于移动机器人自主避障实验第67-70页
     ·自主避障实验结果与分析第70-71页
   ·本章小结第71-73页
第五章 结论与展望第73-75页
致谢第75-76页
参考文献第76-83页
作者在学期间取得的学术成果第83-84页
附录A 缩写词全称对照第84页

论文共84页,点击 下载论文
上一篇:随机并行梯度下降光束净化系统中的光束稳定技术研究
下一篇:基于人机智能融合的移动机器人路径规划方法研究