首页--社会科学总论论文--管理学论文--管理组织学论文

多Agent协作团队的强化学习方法研究

摘要第1-8页
Abstract第8-10页
第一章 绪论第10-24页
   ·研究背景第10-13页
   ·多Agent 学习概述第13-17页
     ·Agent 与多Agent 系统第13-15页
     ·多Agent 学习的研究内容第15-17页
   ·多Agent 强化学习的研究现状和未来研究方向第17-22页
   ·本文的研究内容与结构第22-24页
     ·本文的研究内容第22-23页
     ·本文的结构第23-24页
第二章 相关的研究工作第24-44页
   ·强化学习简介第24-33页
     ·强化学习模型第24-26页
     ·优化行为模型第26-27页
     ·马尔可夫决策过程第27-30页
     ·Q-学习算法第30-33页
   ·多Agent 强化学习基本理论第33-41页
     ·随机博弈框架简介第35-39页
     ·相关算法第39-41页
   ·与本文相关的研究工作第41-43页
   ·本章小结第43-44页
第三章 基于承诺和约定的多 Agent 协同强化学习第44-60页
   ·预备知识第45-50页
     ·多Agent 协作团队第45-47页
     ·任务的分解与分配第47-48页
     ·承诺和约定第48-50页
   ·状态行为空间的缩减第50-51页
   ·Pursuit Game 问题第51-53页
     ·Pursuit Game 问题的相关研究第51-52页
     ·Pursuit Game 的问题描述第52-53页
   ·基于承诺和约定的多Agent 协同强化学习算法第53-56页
   ·算法设计及实验结果第56-59页
     ·算法设计第56-57页
     ·实验及结论第57-59页
   ·本章小结第59-60页
第四章 基于联合行为优先序列的多 Agent 协同强化学习第60-77页
   ·多Agent 协同强化学习的团队随机博弈框架第60-64页
     ·基本概念第60-61页
     ·团队随机博弈框架第61-64页
   ·对接问题描述第64-67页
   ·多最优均衡解问题第67-70页
     ·多最优均衡解问题的研究现状第67页
     ·基于联合行为优先序列的多最优均衡问题解决方法第67-70页
   ·基于联合行为优先序列的多Agent 协同强化学习算法第70-71页
   ·对接问题的实验设定及结果第71-73页
   ·Pursuit Game 问题的实验设定及结果第73-76页
   ·本章小结第76-77页
第五章 总结与展望第77-79页
   ·主要工作与创新第77-78页
   ·进一步的工作第78-79页
致谢第79-80页
参考文献第80-89页
附录第89页

论文共89页,点击 下载论文
上一篇:傅立叶描绘子对形状进行识别与检索
下一篇:三维荧光二阶校正法在药物分析中的应用研究