首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于多机器人系统的K近邻增强学习与运动控制

摘要第1-9页
Abstract第9-11页
第一章 绪论第11-19页
   ·引言第11页
   ·多机器人系统研究的发展第11-14页
   ·多机器人运动控制国内外研究现状第14-16页
     ·避障的基本方法第14-15页
     ·编队的基本方法第15-16页
     ·学习的基本方法第16页
   ·本文的主要工作第16-17页
   ·本文的组织结构第17-19页
第二章 增强学习基本原理及应用第19-25页
   ·引言第19页
   ·增强学习的基本原理第19-21页
     ·增强学习的基本结构第19-20页
     ·马尔可夫决策过程第20页
     ·动作的选择策略第20-21页
   ·增强学习的基本算法第21-24页
     ·TD算法第21-22页
     ·Q学习算法第22-23页
     ·Sarsa算法第23页
     ·DYNA算法第23-24页
   ·增强学习的应用第24页
   ·本章小结第24-25页
第三章 基于激光传感器的动态拟合避障控制第25-39页
   ·引言第25页
   ·控制策略第25-32页
     ·避障控制策略第25-30页
     ·编队控制策略第30-32页
   ·仿真实验第32-38页
     ·实验一 未知环境下机器人避开单个动态障碍仿真实验第32-34页
     ·实验二 未知环境下机器人避开多个动态障碍仿真实验第34-36页
     ·实验三 多机器人编队避开多个障碍第36-38页
   ·结论第38-39页
第四章 局部加权kNN-TD增强学习的机器人运动控制第39-48页
   ·引言第39页
   ·局部加权kNN-TD增强学习的机器人运动控制第39-43页
     ·状态感知第39-41页
     ·基于局部加权k近邻的状态空间分类第41页
     ·动作选择策略第41-42页
     ·kNN-TD算法第42-43页
   ·仿真实验第43-47页
     ·三种算法比较实验第43-45页
     ·局部加权kNN-TD增强学习算法学习速度验证第45-47页
   ·结论第47-48页
第五章 基于局部加权kNN-TD异步多机器人交互学习第48-54页
   ·引言第48页
   ·本章算法第48-51页
     ·局部加权kNN-TD算法第48-49页
     ·全局通信下基于局部加权kNN-TD算法的多机器人交互学习第49-50页
     ·局部通信下基于局部加权kNN-TD算法的多机器人交互学习第50-51页
   ·仿真实验第51-53页
     ·全局通信下多机器人交互学习第51-52页
     ·局部通信下多机器人交互学习第52-53页
   ·结论第53-54页
第六章 总结和展望第54-56页
   ·总结第54页
   ·进一步的研究工作第54-56页
参考文献第56-63页
致谢第63-64页
附录第64-65页

论文共65页,点击 下载论文
上一篇:随机严格反馈非线性系统的自适应神经网络控制
下一篇:非线性切换系统的鲁棒自适应控制研究