多agent协作团队的学习方法研究

摘要	第1-13页
ABSTRACT	第13-15页
第一章绪论	第15-38页
§1.1 研究背景	第15-18页
§1.2 多agent学习概述	第18-25页
·多agent系统	第19-20页
·多agent学习的研究内容	第20-22页
·多agent学习的研究现状	第22-25页
§1.3 多agent强化学习概述	第25-35页
·多agent强化学习的相关研究领域	第25-27页
·强化学习的理论基础	第27-34页
·马尔可夫决策过程	第28-29页
·最优行为模型	第29-30页
·探索与利用的关系	第30-31页
·强化学习的主要算法	第31-34页
·多agent强化学习的研究现状	第34-35页
§1.4 本文的结构	第35-38页
第二章多agent协作求解过程研究	第38-64页
§2.1 多agent协作模型概述	第38-39页
§2.2 多agent协作求解框架	第39-48页
·多agent协作团队	第39-42页
·理性BDI模型	第42-45页
·承诺和约定	第45-47页
·多agent协作求解的过程	第47-48页
§2.3 多agent系统开发平台MBOS	第48-62页
·MBOS简介	第48-49页
·AGENTFRAME结构	第49-52页
·会话管理的实现	第52-62页
·交互协议的制定	第53-56页
·交互协议的状态转换	第56-59页
·交互协议的消息处理	第59-62页
§2.4 协作和学习的关系	第62-63页
§2.5 本章小结	第63-64页
第三章共享经验元组的多agent协同强化学习	第64-84页
§3.1 角色分配	第64-71页
·角色分配的要求	第65-66页
·多agent协作团队的偶图表示	第66-67页
·基于偶图的角色分配算法	第67-71页
·角色分配的优化	第71页
§3.2 Q学习算法	第71-74页
·评估函数的确立	第71-72页
·Q值的更新	第72-74页
§3.3 多agent协同强化学习算法SE-MACOL	第74-80页
·问题域描述	第74-77页
·状态行为空间的缩减	第77-78页
·共享经验元组	第78-80页
§3.4 实验及结果分析	第80-83页
§3.5 本章小结	第83-84页
第四章基于团队马尔可夫博弈的多agent协同强化学习	第84-106页
§4.1 引言	第84-85页
§4.2 马尔可夫博弈	第85-88页
·博弈论	第85-86页
·矩阵博弈	第86页
·马尔可夫博弈	第86-88页
§4.3 多agent协同强化学习算法TMG-MACOL	第88-100页
·相关定义	第88-91页
·问题域描述	第91-93页
·阶段博弈的结果评估	第93-95页
·虚拟行动过程	第95-97页
·TMG-MACOL算法	第97-100页
§4.4 实验及结果分析	第100-105页
§4.5 本章小结	第105-106页
第五章改进团队协作性能的其他学习方法	第106-119页
§5.1 确定团队的结构及其学习	第106-111页
·基于案例的推理	第107-108页
·案例的结构设计	第108-109页
·基于模糊理论的相似性计算	第109-111页
§5.2 确定团队的运作过程及其学习	第111-117页
·方法的提出	第111-112页
·基于讨论区的共识学习方法	第112-114页
·应用实例	第114-117页
§5.3 本章小结	第117-119页
第六章应用实例	第119-128页
§6.1 军事应用背景	第119-120页
§6.2 案例描述	第120-122页
·作战想定	第120页
·理论准备	第120-122页
·案例中的协同学习	第122页
§6.3 仿真实验的过程	第122-124页
§6.4 实验结果	第124-127页
§6.5 本章小结	第127-128页
第七章总结与展望	第128-131页
§7.1 主要工作与创新	第128-130页
§7.2 进一步的工作	第130-131页
致谢	第131-133页
参考文献	第133-140页
附录A 作者攻读博士学位期间发表的学术论文	第140-142页
附录B 作者攻读博士学位期间参加的科研项目	第142页