首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于社区感知网络的多机器人系统Q-学习与运动控制研究

摘要第1-11页
Abstract第11-13页
第一章 绪论第13-24页
   ·引言第13页
   ·网络机器人的研究现状第13-15页
   ·社区感知网络的提出第15-16页
   ·信息交互第16-17页
   ·机器人强化学习算法研究现状第17-21页
     ·增强学习基本思想第17-18页
     ·相关算法介绍第18-20页
     ·增强学习在多机器人系统中的应用第20-21页
     ·小结第21页
   ·本文的主要工作第21-22页
   ·本文的组织结构第22-24页
第二章 基于社区感知网络的多机器人Q-学习与运动控制第24-32页
   ·引言第24-25页
   ·社区网络架构第25-26页
   ·社区网络多机器人的运动控制研究第26-28页
     ·基于社区网络的多机器人Q-学习第26-27页
     ·动作选择策略第27页
     ·算法步骤第27-28页
   ·仿真实验及结果分析第28-31页
     ·实验场景和机器人参数设置第28-30页
     ·两种算法比较及运动控制实验第30-31页
   ·结论第31-32页
第三章 基于社区网络的多机器人在线ε-半径近邻Q-学习第32-43页
   ·引言第32-33页
   ·社区环境感知描述第33-34页
   ·基于社区感知网络的多机器人ε-半径近邻Q-学习第34-37页
     ·在线ε-半径近邻的状态分类方法第34-36页
     ·算法描述第36-37页
   ·实验验证第37-41页
     ·实验环境及参数设置第37-39页
     ·矩阵范数分析第39-40页
     ·三种算法比较及运动控制实验第40-41页
   ·结论第41-43页
第四章 基于等时延社区感知网络的多机器人Q-学习与运动控制第43-53页
   ·引言第43-44页
   ·等时滞社区网络架构描述第44页
   ·基于等时滞社区信息共享机制的实现第44-46页
     ·社区信息共享机制架构第44-45页
     ·社区Q值表动态更新规则第45-46页
   ·基于等时滞社区网络的Q-学习第46-47页
   ·仿真实验第47-52页
     ·机器人及社区网络参数设置第47-48页
     ·三种算法的比较实验第48-50页
     ·算法收敛速度验证实验第50-52页
   ·结论第52-53页
第五章 基于异时滞社区感知网络的多机器人行为一致性Q-学习与运动控制第53-68页
   ·引言第53-54页
   ·异时滞网络架构第54-56页
     ·社区网络描述第54-55页
     ·拓扑网络的形成第55-56页
     ·拓扑网络的时滞描述第56页
   ·编队控制策略第56-59页
     ·领航机器人动态切换策略第56-57页
     ·基于行为一致性的奖赏函数的设计第57-59页
   ·基于异时滞拓扑网络的多机器人行为一致性Q-学习第59-60页
   ·仿真实验第60-67页
     ·多机器人系统的社区参数介绍第60-62页
     ·算法仿真实验的实现第62-66页
     ·实验结果分析第66-67页
   ·结论第67-68页
第六章 总结和展望第68-71页
   ·总结第68-69页
   ·进一步的研究工作第69-71页
参考文献第71-81页
致谢第81-82页
附录第82-83页

论文共83页,点击 下载论文
上一篇:基于第二代Curvelet的图像融合
下一篇:水下机器人运动控制与路径规划研究