摘要 | 第1-6页 |
Abstract | 第6-14页 |
第1章 绪论 | 第14-36页 |
·引言 | 第14页 |
·多机器人系统研究内容综述 | 第14-22页 |
·多机器人系统主要研究内容 | 第14-18页 |
·国内外多机器人系统研究现状 | 第18-21页 |
·多机器人系统存在的问题 | 第21-22页 |
·多机器人追捕逃跑问题综述 | 第22-25页 |
·多机器人追捕逃跑问题及主要研究内容 | 第22-23页 |
·多机器人追捕逃跑问题研究现状 | 第23-24页 |
·多机器人追捕逃跑问题研究思路 | 第24-25页 |
·多机器人学习综述 | 第25-33页 |
·多机器人学习研究内容及研究现状 | 第25-30页 |
·多机器人学习存在的问题 | 第30-32页 |
·多机器人学习研究方向 | 第32-33页 |
·本课题的研究意义和研究内容 | 第33-36页 |
·课题背景及研究的目的和意义 | 第33-34页 |
·本文的主要工作 | 第34-36页 |
第2章 基于强化学习的多机器人协调与协作 | 第36-59页 |
·引言 | 第36页 |
·多机器人的协调与协作 | 第36-42页 |
·协调与协作问题概述 | 第36-39页 |
·协调与协作研究存在的问题 | 第39-42页 |
·多智能体协调与协作的研究平台 | 第42页 |
·利用强化学习方法解决多机器人协作与协调问题 | 第42-44页 |
·强化学习 | 第44-50页 |
·强化学习相关理论及模型 | 第44-45页 |
·强化学习系统的基本要素 | 第45-47页 |
·马尔可夫决策过程 | 第47-50页 |
·强化学习的主要算法 | 第50-54页 |
·探索策略 | 第50-51页 |
·瞬时差分算法 | 第51-52页 |
·Sarsa 算法 | 第52页 |
·Q-学习算法 | 第52-54页 |
·基于强化学习的多机器人追捕问题研究 | 第54-57页 |
·基于强化学习求解多机器人协作追捕问题的思路 | 第54-55页 |
·基于Q 学习的多机器人强化学习算法 | 第55-57页 |
·小结 | 第57-59页 |
第3章 已知环境下基于强化学习的多机器人协作追捕问题研究 | 第59-86页 |
·引言 | 第59-60页 |
·多机器人追捕问题 | 第60-71页 |
·问题描述 | 第60-61页 |
·基于分区的主从式组织结构的追捕团队形成算法 | 第61-65页 |
·基于分区主从式组织结构的多机器人追捕算法 | 第65-68页 |
·仿真实验 | 第68-70页 |
·算法评价 | 第70-71页 |
·改进的多机器人追捕算法 | 第71-85页 |
·关联规则数据挖掘技术组建追捕团队 | 第72-78页 |
·基于分段式强化学习的多机器人追捕算法 | 第78-81页 |
·仿真实验 | 第81-85页 |
·本章小结 | 第85-86页 |
第4章 未知环境下基于强化学习的多机器人协作追捕问题研究 | 第86-117页 |
·引言 | 第86-87页 |
·完成追捕任务的整体方案 | 第87-105页 |
·目标搜索 | 第88-89页 |
·确定追捕者之间的协作关系 | 第89-92页 |
·基于多团队强化学习方法多机器人协作追捕目标 | 第92-100页 |
·仿真实验 | 第100-105页 |
·基于案例推理的强化学习在多机器人追捕问题中的应用 | 第105-115页 |
·构建系统案例库 | 第105-106页 |
·确定相应案例子集 | 第106-110页 |
·基于案例推理的多机器人强化学习 | 第110-111页 |
·系统案例库的更新 | 第111-112页 |
·多agent 学习过程 | 第112页 |
·仿真试验 | 第112-115页 |
·本章小结 | 第115-117页 |
第5章 多机器人协作追捕问题仿真试验系统 | 第117-126页 |
·引言 | 第117-118页 |
·仿真系统设计 | 第118-120页 |
·总体设计 | 第118页 |
·逃跑者 | 第118-119页 |
·追捕者 | 第119页 |
·传感器 | 第119-120页 |
·仿真实验系统 | 第120-125页 |
·系统的主要功能 | 第120-121页 |
·仿真试验演示 | 第121-125页 |
·本章小结 | 第125-126页 |
结论 | 第126-129页 |
参考文献 | 第129-141页 |
攻读博士学位期间发表的论文 | 第141-143页 |
致谢 | 第143-144页 |
个人简历 | 第144页 |