目标明确的释放型操作示教与增强学习研究

摘要	第4-5页
abstract	第5-6页
第1章引言	第11-22页
1.1 研究背景	第11-12页
1.2 国内外研究现状	第12-18页
1.3 示教学习概述	第18-19页
1.4 增强学习概述	第19-20页
1.5 研究内容及论文结构	第20-21页
1.6 本章小结	第21-22页
第2章机器人平台及运动学模型	第22-31页
2.1 机器人平台	第22-23页
2.1.1 WAM四自由度机械臂平台	第22页
2.1.2 三指机械手BarrettHand	第22-23页
2.1.3 六轴力矩传感器	第23页
2.2 机器人整体控制架构	第23-24页
2.2.1 上层控制架构	第23-24页
2.2.2 底层控制架构	第24页
2.3 机器人运动学	第24-29页
2.3.1 机器人正向运动学	第25-27页
2.3.2 机器人逆向运动学	第27-29页
2.4 本章小结	第29-31页
第3章基于示教学习方法的运动轨迹学习	第31-39页
3.1 示教学习方法介绍	第31页
3.2 多虚拟弹簧阻尼系统运动轨迹学习	第31-35页
3.2.1 传统虚拟弹簧阻尼系统	第31-32页
3.2.2 多虚拟弹簧阻尼系统介绍	第32页
3.2.3 多虚拟弹簧阻尼系统的非时变性	第32-33页
3.2.4 多虚拟弹簧阻尼系统的泛化性	第33-35页
3.3 基于交互力示教的柔顺操作学习	第35-38页
3.3.1 交互力示教过程	第35-36页
3.3.2 学习变化的刚度	第36页
3.3.3 估计阻尼系数	第36-37页
3.3.4 重新生成轨迹	第37-38页
3.4 本章小结	第38-39页
第4章基于增强学习的释放型操作优化	第39-61页
4.1 基于动态运动基元的示教学习方法	第39-42页
4.1.1 动态运动基元示教学习方法介绍	第39-40页
4.1.2 动态运动基元法动力学方程	第40-41页
4.1.3 释放型操作的动态运动基元法改进	第41-42页
4.1.4 基于动态运动基元的示教学习	第42页
4.2 基于路径积分的策略提升增强学习方法	第42-48页
4.2.1 基于路径积分的策略提升方法介绍	第42页
4.2.2 随机最优控制	第42-43页
4.2.3 HJB方程的指数化	第43-44页
4.2.4 广义路径积分	第44页
4.2.5 最优控制	第44-46页
4.2.6 参数化策略表达	第46-48页
4.3 基于示教与增强学习的释放型操作实验结果与对比分析	第48-59页
4.3.1 基于示教与增强学习的释放型操作实验设计及参数设置	第48-50页
4.3.2 基于模型的学习方法释放型操作实验设计及参数设置	第50-51页
4.3.3 实验结果与对比分析	第51-59页
4.4 本章小结	第59-61页
第5章总结与展望	第61-63页
5.1 总结	第61-62页
5.2 展望	第62-63页
参考文献	第63-69页
致谢	第69-71页
作者简历及攻读学位期间发表的学术论文与研究成果	第71页