首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机械手论文

分层强化学习研究及其在机械臂避障问题中的应用

摘要第1-4页
ABSTRACT第4-8页
1 引言第8-14页
   ·研究背景和意义第8-9页
   ·研究现状第9-12页
   ·本文研究内容第12页
   ·论文结构第12-14页
2 分层强化学习第14-30页
   ·强化学习第14-19页
     ·MDP 与 SMDP第14-17页
     ·强化学习原理与方法第17-19页
   ·分层强化学习第19-28页
     ·学习任务的分层与抽象第19-21页
     ·分层强化学习基本方法第21-26页
     ·自动分层的必要性和可行性分析第26-28页
   ·本章小结第28-30页
3 基于动作信息量的自动分层第30-50页
   ·基本概念第30-33页
     ·熵和互信息第30-31页
     ·率失真理论第31-32页
     ·贝叶斯网络第32-33页
   ·基于动作信息量的 Subgoal 识别第33-40页
     ·单任务学习下的动作信息第33-36页
     ·多任务学习下的动作信息第36-38页
     ·基于动作信息的 Subgoal 识别第38-40页
   ·基于动作信息量的自动分层算法第40-42页
   ·实验与分析第42-48页
     ·实验用例与环境搭建第42-44页
     ·实验结果分析第44-48页
   ·本章小结第48-50页
4 机械臂避碰的分层强化学习模型第50-72页
   ·机械臂避碰系统的建模和仿真第50-55页
     ·机械臂的运动学建模第50-52页
     ·基于 ODE 的避碰仿真第52-55页
   ·避碰问题的分层强化学习模型第55-63页
     ·轨迹动作层学习第57-61页
     ·路径行为层学习第61-63页
   ·仿真实验及分析第63-70页
     ·经典强化学习与分层强化学习对比实验第64-68页
     ·环境变化下的分层强化学习实验第68-70页
   ·本章小结第70-72页
5 总结与展望第72-74页
致谢第74-76页
参考文献第76-80页
附录第80页
 作者在攻读硕士学位期间发表的论文第80页
 作者在攻读学位期间取得的科研成果目录第80页

论文共80页,点击 下载论文
上一篇:基于子空间广义预测控制算法的CVT控制系统
下一篇:离散神经网络在随机扰动下的脉冲控制