致谢 | 第5-6页 |
摘要 | 第6-8页 |
Abstract | 第8-9页 |
第1章 绪论 | 第17-33页 |
1.1 背景和意义 | 第17-18页 |
1.2 研究现状 | 第18-29页 |
1.2.1 数据获取 | 第19-20页 |
1.2.2 动作策略学习 | 第20-25页 |
1.2.3 动作回报学习 | 第25-27页 |
1.2.4 外力估计 | 第27-29页 |
1.3 本文研究内容和主要贡献 | 第29-31页 |
1.4 本文组织结构 | 第31-33页 |
第2章 面向仿人型机械臂的动作策略学习 | 第33-63页 |
2.1 引言 | 第33-34页 |
2.2 示教动作的人机对应 | 第34-38页 |
2.2.1 仿射空间与仿射变换 | 第34-35页 |
2.2.2 基于仿射变换的人机动作对应 | 第35-38页 |
2.3 动作建模及泛化 | 第38-42页 |
2.3.1 基于高斯混合模型的动作建模方法 | 第38-40页 |
2.3.2 结合高斯混合模型和动态运动单元的动作生成方法 | 第40-42页 |
2.4 关节运动轨迹生成 | 第42-45页 |
2.4.1 基于序列二次规划的关节运动轨迹生成 | 第42-44页 |
2.4.2 初值选择 | 第44-45页 |
2.5 实验结果 | 第45-60页 |
2.5.1 数据采集 | 第45-48页 |
2.5.2 人机动作对应结果 | 第48-55页 |
2.5.3 仿人动作的建模和泛化结果 | 第55-60页 |
2.5.4 关节轨迹生成算法的效果 | 第60页 |
2.6 本章小结 | 第60-63页 |
第3章 多阶段动作回报学习 | 第63-87页 |
3.1 引言 | 第63-64页 |
3.2 动作分段与回报学习 | 第64-72页 |
3.2.1 问题描述 | 第64-65页 |
3.2.2 基于滑动窗口轨迹的逆强化学习算法 | 第65-69页 |
3.2.3 基于动态规划的分段点搜索优化算法 | 第69-72页 |
3.3 动作生成 | 第72-75页 |
3.3.1 目标泛函的构建 | 第72-74页 |
3.3.2 目标泛函的优化 | 第74-75页 |
3.4 实验结果 | 第75-85页 |
3.4.1 仿真操作任务 | 第75-79页 |
3.4.2 水杯搬运任务 | 第79-85页 |
3.5 本章小结 | 第85-87页 |
第4章 基于扰动卡尔曼滤波器的未知外力估计与碰撞响应 | 第87-113页 |
4.1 引言 | 第87-88页 |
4.2 系统框架 | 第88-89页 |
4.3 半参数逆动力学模型辨识方法 | 第89-92页 |
4.3.1 刚体动力学模型辨识 | 第89-90页 |
4.3.2 基于多层感知机的模型误差补偿 | 第90-92页 |
4.4 扰动卡尔曼滤波器 | 第92-96页 |
4.4.1 过程模型和观测模型 | 第92-95页 |
4.4.2 扰动卡尔曼滤波算法 | 第95-96页 |
4.5 保证安全的碰撞检测和响应策略 | 第96-98页 |
4.5.1 碰撞检测 | 第97页 |
4.5.2 安全响应 | 第97-98页 |
4.6 实验结果 | 第98-112页 |
4.6.1 逆动力学模型建模结果 | 第99-102页 |
4.6.2 外力估计结果 | 第102-111页 |
4.6.3 碰撞检测和安全响应结果 | 第111-112页 |
4.7 本章小结 | 第112-113页 |
第5章 总结与展望 | 第113-115页 |
5.1 总结 | 第113-114页 |
5.2 展望 | 第114-115页 |
参考文献 | 第115-125页 |
作者简历 | 第125-127页 |
攻读博士学位期间的主要研究成果 | 第127页 |