基于强化学习的机械臂避碰研究

摘要	第1-5页
Abstract	第5-8页
1 绪论	第8-14页
·课题的来源、目的及意义	第8-9页
·国内外研究现状	第9-12页
·本文的主要工作	第12-14页
2 机械臂多 agent 避碰系统	第14-20页
·冗余度机器人	第14-15页
·机械臂多 agent 避碰系统结构	第15-16页
·系统状态变量	第16-17页
·机械臂避碰问题的数学描述	第17-19页
·本章小结	第19-20页
3 基于强化学习的机械臂避碰算法	第20-31页
·强化学习模型	第20-23页
·强化学习主要算法	第23-25页
·结合有效迹的强化学习方法	第25-28页
·强化学习中的函数估计	第28页
·多 agent 强化学习	第28-29页
·机械臂避碰系统算法实施	第29-30页
·本章小结	第30-31页
4 连续状态空间的自适应划分	第31-39页
·强化学习问题的状态空间划分方法	第31-35页
·K-均值聚类	第35-36页
·基于K-均值聚类的强化学习方法	第36-37页
·本章小结	第37-39页
5 仿真实验	第39-53页
·仿真平台介绍	第39-41页
·对状态空间进行硬划分的避碰试验	第41-46页
·对状态空间进行自适应划分的避碰试验	第46-52页
·本章小结	第52-53页
6 全文总结及展望	第53-55页
·总结	第53页
·展望	第53-55页
致谢	第55-56页
参考文献	第56-60页
附录1 攻读学位期间发表论文目录	第60页