首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文

基于强化学习的多机器人协作控制方法研究

摘要第1-7页
 Abstract第7-10页
第1章 绪论第10-18页
   ·课题研究的背景及意义第10页
   ·多机器人协作控制方法研究第10-12页
   ·多机器人系统及强化学习在其应用的研究现状第12-17页
     ·多机器人系统的研究现状第12-15页
     ·强化学习在多机器人系统中应用的研究现状第15-17页
   ·本文的组织结构第17-18页
第2章 强化学习理论与算法第18-25页
   ·马尔可夫决策过程第18页
   ·强化学习系统的模型与基本要素第18-21页
   ·强化学习的主要算法第21-24页
     ·动态规划算法第21-22页
     ·蒙特卡罗算法第22-23页
     ·瞬时差分算法第23页
     ·Q 学习算法第23-24页
   ·本章小结第24-25页
第3章 机器人路径规划的强化学习方法第25-39页
   ·静态环境中机器人路径规划第25-33页
     ·传感器模型第25-26页
     ·静态环境中路径探索策略第26-29页
     ·机器人的动作选择策略第29-31页
     ·仿真实验与分析第31-33页
   ·动态环境中机器人路径规划第33-38页
     ·动态环境中路径探索策略第34-36页
     ·仿真实验与分析第36-38页
   ·本章小结第38-39页
第4章 多机器人协作围捕的混合强化学习方法第39-58页
   ·系统体系结构第39-41页
   ·多机器人协作围捕的强化学习系统结构第41-42页
   ·模糊 Q 学习第42-48页
     ·模糊逻辑介绍第42-44页
     ·模糊 Q 学习第44-48页
   ·启发式奖惩函数第48-51页
     ·启发式奖惩函数的提出第48-50页
     ·启发式奖惩函数的设计第50-51页
   ·机器人行为冲突消解第51-52页
     ·黑板通信方式第51-52页
     ·基于协商和意愿强度的协调方法第52页
   ·仿真实验与分析第52-57页
     ·围捕任务介绍第52-54页
     ·实验结果与分析第54-57页
   ·本章小结第57-58页
结论第58-60页
参考文献第60-66页
攻读硕士学位期间发表的论文和取得的科研成果第66-67页
致谢第67-68页

论文共68页,点击 下载论文
上一篇:基于OPC技术的水处理控制系统的研究
下一篇:火灾自动检测技术在无人值守变电站中的应用