首页--工业技术论文--自动化技术、计算机技术论文--自动化技术及设备论文--机器人技术论文--机器人论文--工业机器人论文

基于强化学习的多机器人追捕问题研究

摘要第1-6页
Abstract第6-14页
第1章 绪论第14-36页
   ·引言第14页
   ·多机器人系统研究内容综述第14-22页
     ·多机器人系统主要研究内容第14-18页
     ·国内外多机器人系统研究现状第18-21页
     ·多机器人系统存在的问题第21-22页
   ·多机器人追捕逃跑问题综述第22-25页
     ·多机器人追捕逃跑问题及主要研究内容第22-23页
     ·多机器人追捕逃跑问题研究现状第23-24页
     ·多机器人追捕逃跑问题研究思路第24-25页
   ·多机器人学习综述第25-33页
     ·多机器人学习研究内容及研究现状第25-30页
     ·多机器人学习存在的问题第30-32页
     ·多机器人学习研究方向第32-33页
   ·本课题的研究意义和研究内容第33-36页
     ·课题背景及研究的目的和意义第33-34页
     ·本文的主要工作第34-36页
第2章 基于强化学习的多机器人协调与协作第36-59页
   ·引言第36页
   ·多机器人的协调与协作第36-42页
     ·协调与协作问题概述第36-39页
     ·协调与协作研究存在的问题第39-42页
     ·多智能体协调与协作的研究平台第42页
   ·利用强化学习方法解决多机器人协作与协调问题第42-44页
   ·强化学习第44-50页
     ·强化学习相关理论及模型第44-45页
     ·强化学习系统的基本要素第45-47页
     ·马尔可夫决策过程第47-50页
   ·强化学习的主要算法第50-54页
     ·探索策略第50-51页
     ·瞬时差分算法第51-52页
     ·Sarsa 算法第52页
     ·Q-学习算法第52-54页
   ·基于强化学习的多机器人追捕问题研究第54-57页
     ·基于强化学习求解多机器人协作追捕问题的思路第54-55页
     ·基于Q 学习的多机器人强化学习算法第55-57页
   ·小结第57-59页
第3章 已知环境下基于强化学习的多机器人协作追捕问题研究第59-86页
   ·引言第59-60页
   ·多机器人追捕问题第60-71页
     ·问题描述第60-61页
     ·基于分区的主从式组织结构的追捕团队形成算法第61-65页
     ·基于分区主从式组织结构的多机器人追捕算法第65-68页
     ·仿真实验第68-70页
     ·算法评价第70-71页
   ·改进的多机器人追捕算法第71-85页
     ·关联规则数据挖掘技术组建追捕团队第72-78页
     ·基于分段式强化学习的多机器人追捕算法第78-81页
     ·仿真实验第81-85页
   ·本章小结第85-86页
第4章 未知环境下基于强化学习的多机器人协作追捕问题研究第86-117页
   ·引言第86-87页
   ·完成追捕任务的整体方案第87-105页
     ·目标搜索第88-89页
     ·确定追捕者之间的协作关系第89-92页
     ·基于多团队强化学习方法多机器人协作追捕目标第92-100页
     ·仿真实验第100-105页
   ·基于案例推理的强化学习在多机器人追捕问题中的应用第105-115页
     ·构建系统案例库第105-106页
     ·确定相应案例子集第106-110页
     ·基于案例推理的多机器人强化学习第110-111页
     ·系统案例库的更新第111-112页
     ·多agent 学习过程第112页
     ·仿真试验第112-115页
   ·本章小结第115-117页
第5章 多机器人协作追捕问题仿真试验系统第117-126页
   ·引言第117-118页
   ·仿真系统设计第118-120页
     ·总体设计第118页
     ·逃跑者第118-119页
     ·追捕者第119页
     ·传感器第119-120页
   ·仿真实验系统第120-125页
     ·系统的主要功能第120-121页
     ·仿真试验演示第121-125页
   ·本章小结第125-126页
结论第126-129页
参考文献第129-141页
攻读博士学位期间发表的论文第141-143页
致谢第143-144页
个人简历第144页

论文共144页,点击 下载论文
上一篇:空间柔性机器人在轨抓取与转移目标动力学与控制
下一篇:轮足混合驱动爬壁机器人及其关键技术的研究