基于Q学习的欠驱动双足机器人行走控制研究
| 致谢 | 第1-6页 |
| 摘要 | 第6-7页 |
| Abstract | 第7-8页 |
| 目录 | 第8-10页 |
| 第1章 绪论 | 第10-22页 |
| ·引言 | 第10页 |
| ·双足机器人控制研究现状 | 第10-14页 |
| ·国外双足机器人研究现状 | 第10-12页 |
| ·国内双足机器人研究现状 | 第12-14页 |
| ·欠驱动双足步行机器人 | 第14-19页 |
| ·强化学习概述 | 第19-20页 |
| ·本文主要内容 | 第20-22页 |
| 第2章 双足机器人模型及驱动器选型 | 第22-40页 |
| ·欠驱动步行机器人动力学模型 | 第23-28页 |
| ·单足支撑阶段 | 第24-27页 |
| ·双足支撑阶段 | 第27-28页 |
| ·混杂动力学模型 | 第28页 |
| ·柔性驱动器的选择 | 第28-37页 |
| ·串联弹性驱动器 | 第30页 |
| ·AMASC驱动器 | 第30-31页 |
| ·MACCEPA驱动器 | 第31-34页 |
| ·人工气动肌肉 | 第34-36页 |
| ·四种柔性驱动器的比较 | 第36-37页 |
| ·本章小结 | 第37-40页 |
| 第3章 基于神经网络的Q学习控制 | 第40-58页 |
| ·Q学习方法 | 第41页 |
| ·RBF神经网络概述 | 第41-42页 |
| ·基于RBF神经网络的Q学习 | 第42-48页 |
| ·基本思想 | 第42页 |
| ·等效倒立摆模型 | 第42-44页 |
| ·基于RBF神经网络的Q学习算法 | 第44-46页 |
| ·欠驱动机器人控制系统 | 第46-48页 |
| ·仿真 | 第48-52页 |
| ·能量效率 | 第52-53页 |
| ·经验回放提高学习效率 | 第53-56页 |
| ·本章小结 | 第56-58页 |
| 第4章 动力学仿真平台与物理样机 | 第58-70页 |
| ·动力学仿真平台 | 第58-61页 |
| ·联合仿真平台 | 第61-64页 |
| ·仿人机器人控制系统结构 | 第64-68页 |
| ·主控层 | 第65-67页 |
| ·执行层 | 第67页 |
| ·通信层 | 第67-68页 |
| ·本章小结 | 第68-70页 |
| 第5章 总结与展望 | 第70-72页 |
| ·主要研究内容总结 | 第70-71页 |
| ·未来工作展望 | 第71-72页 |
| 参考文献 | 第72-78页 |
| 作者在攻读硕士学位期间的科研成果 | 第78页 |