首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机械手论文

强化学习在机械手路径规划中的应用

第1章 绪论第1-17页
   ·引言第8页
   ·路径规划技术的研究现状第8-11页
     ·全局路径规划方法第9页
     ·局部路径规划方法第9-11页
   ·强化学习技术的发展历史第11-13页
   ·强化学习技术的研究现状第13-15页
   ·本文各章节结构安排第15-17页
第2章 单智能体强化学习第17-34页
   ·简介第17-18页
   ·马尔可夫决策过程(MDP)第18-21页
   ·动态规划方法第21-24页
     ·值迭代第22页
     ·策略迭代第22-24页
   ·蒙特卡洛算法第24-25页
   ·瞬时差分算法第25-29页
     ·瞬时差分(Temporal Difference)第25-26页
     ·探索和利用(Exploration versus Exploitation)第26-27页
     ·Sarsa算法第27-28页
     ·Q学习算法第28-29页
   ·多步强化学习第29-33页
     ·多步 TD算法第29-31页
     ·多步 Sarsa算法第31-32页
     ·多步 Q算法第32-33页
   ·本章小结第33-34页
第3章 多智能体强化学习第34-47页
   ·理论基础第34-40页
     ·Markov对策第34-36页
     ·Nash均衡第36-37页
     ·概念介绍第37-38页
     ·基本算法第38-40页
   ·算法改进第40-46页
     ·基本思想第41-42页
     ·预测动作第42-44页
     ·预测状态第44-46页
   ·本章小结第46-47页
第4章 机械手路径规划第47-63页
   ·机械手工作环境第47-48页
   ·碰撞检测第48-51页
   ·状态及动作分割第51-54页
     ·状态分割第51-54页
     ·动作分割第54页
   ·强化学习回报函数设计第54-55页
   ·结构信度分配第55-56页
   ·动作选择机制第56-58页
     ·单智能体强化学习动作选择第56-57页
     ·机械手强化学习动作选择第57-58页
   ·仿真程序算法第58-60页
   ·机械手路径规划仿真第60-62页
   ·本章小结第62-63页
结论第63-64页
参考文献第64-67页
攻读硕士学位期间发表的论文和取得的科研成果第67-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:跨越抽油机基础的修井钻台研究
下一篇:精索静脉曲张大鼠睾丸组织中HIF-1α的表达及意义