基于多机器人系统的K近邻增强学习与运动控制

摘要	第1-9页
Abstract	第9-11页
第一章绪论	第11-19页
·引言	第11页
·多机器人系统研究的发展	第11-14页
·多机器人运动控制国内外研究现状	第14-16页
·避障的基本方法	第14-15页
·编队的基本方法	第15-16页
·学习的基本方法	第16页
·本文的主要工作	第16-17页
·本文的组织结构	第17-19页
第二章增强学习基本原理及应用	第19-25页
·引言	第19页
·增强学习的基本原理	第19-21页
·增强学习的基本结构	第19-20页
·马尔可夫决策过程	第20页
·动作的选择策略	第20-21页
·增强学习的基本算法	第21-24页
·TD算法	第21-22页
·Q学习算法	第22-23页
·Sarsa算法	第23页
·DYNA算法	第23-24页
·增强学习的应用	第24页
·本章小结	第24-25页
第三章基于激光传感器的动态拟合避障控制	第25-39页
·引言	第25页
·控制策略	第25-32页
·避障控制策略	第25-30页
·编队控制策略	第30-32页
·仿真实验	第32-38页
·实验一未知环境下机器人避开单个动态障碍仿真实验	第32-34页
·实验二未知环境下机器人避开多个动态障碍仿真实验	第34-36页
·实验三多机器人编队避开多个障碍	第36-38页
·结论	第38-39页
第四章局部加权kNN-TD增强学习的机器人运动控制	第39-48页
·引言	第39页
·局部加权kNN-TD增强学习的机器人运动控制	第39-43页
·状态感知	第39-41页
·基于局部加权k近邻的状态空间分类	第41页
·动作选择策略	第41-42页
·kNN-TD算法	第42-43页
·仿真实验	第43-47页
·三种算法比较实验	第43-45页
·局部加权kNN-TD增强学习算法学习速度验证	第45-47页
·结论	第47-48页
第五章基于局部加权kNN-TD异步多机器人交互学习	第48-54页
·引言	第48页
·本章算法	第48-51页
·局部加权kNN-TD算法	第48-49页
·全局通信下基于局部加权kNN-TD算法的多机器人交互学习	第49-50页
·局部通信下基于局部加权kNN-TD算法的多机器人交互学习	第50-51页
·仿真实验	第51-53页
·全局通信下多机器人交互学习	第51-52页
·局部通信下多机器人交互学习	第52-53页
·结论	第53-54页
第六章总结和展望	第54-56页
·总结	第54页
·进一步的研究工作	第54-56页
参考文献	第56-63页
致谢	第63-64页
附录	第64-65页