摘要 | 第1-13页 |
ABSTRACT | 第13-15页 |
第一章 绪论 | 第15-38页 |
§1.1 研究背景 | 第15-18页 |
§1.2 多agent学习概述 | 第18-25页 |
·多agent系统 | 第19-20页 |
·多agent学习的研究内容 | 第20-22页 |
·多agent学习的研究现状 | 第22-25页 |
§1.3 多agent强化学习概述 | 第25-35页 |
·多agent强化学习的相关研究领域 | 第25-27页 |
·强化学习的理论基础 | 第27-34页 |
·马尔可夫决策过程 | 第28-29页 |
·最优行为模型 | 第29-30页 |
·探索与利用的关系 | 第30-31页 |
·强化学习的主要算法 | 第31-34页 |
·多agent强化学习的研究现状 | 第34-35页 |
§1.4 本文的结构 | 第35-38页 |
第二章 多agent协作求解过程研究 | 第38-64页 |
§2.1 多agent协作模型概述 | 第38-39页 |
§2.2 多agent协作求解框架 | 第39-48页 |
·多agent协作团队 | 第39-42页 |
·理性BDI模型 | 第42-45页 |
·承诺和约定 | 第45-47页 |
·多agent协作求解的过程 | 第47-48页 |
§2.3 多agent系统开发平台MBOS | 第48-62页 |
·MBOS简介 | 第48-49页 |
·AGENTFRAME结构 | 第49-52页 |
·会话管理的实现 | 第52-62页 |
·交互协议的制定 | 第53-56页 |
·交互协议的状态转换 | 第56-59页 |
·交互协议的消息处理 | 第59-62页 |
§2.4 协作和学习的关系 | 第62-63页 |
§2.5 本章小结 | 第63-64页 |
第三章 共享经验元组的多agent协同强化学习 | 第64-84页 |
§3.1 角色分配 | 第64-71页 |
·角色分配的要求 | 第65-66页 |
·多agent协作团队的偶图表示 | 第66-67页 |
·基于偶图的角色分配算法 | 第67-71页 |
·角色分配的优化 | 第71页 |
§3.2 Q学习算法 | 第71-74页 |
·评估函数的确立 | 第71-72页 |
·Q值的更新 | 第72-74页 |
§3.3 多agent协同强化学习算法SE-MACOL | 第74-80页 |
·问题域描述 | 第74-77页 |
·状态行为空间的缩减 | 第77-78页 |
·共享经验元组 | 第78-80页 |
§3.4 实验及结果分析 | 第80-83页 |
§3.5 本章小结 | 第83-84页 |
第四章 基于团队马尔可夫博弈的多agent协同强化学习 | 第84-106页 |
§4.1 引言 | 第84-85页 |
§4.2 马尔可夫博弈 | 第85-88页 |
·博弈论 | 第85-86页 |
·矩阵博弈 | 第86页 |
·马尔可夫博弈 | 第86-88页 |
§4.3 多agent协同强化学习算法TMG-MACOL | 第88-100页 |
·相关定义 | 第88-91页 |
·问题域描述 | 第91-93页 |
·阶段博弈的结果评估 | 第93-95页 |
·虚拟行动过程 | 第95-97页 |
·TMG-MACOL算法 | 第97-100页 |
§4.4 实验及结果分析 | 第100-105页 |
§4.5 本章小结 | 第105-106页 |
第五章 改进团队协作性能的其他学习方法 | 第106-119页 |
§5.1 确定团队的结构及其学习 | 第106-111页 |
·基于案例的推理 | 第107-108页 |
·案例的结构设计 | 第108-109页 |
·基于模糊理论的相似性计算 | 第109-111页 |
§5.2 确定团队的运作过程及其学习 | 第111-117页 |
·方法的提出 | 第111-112页 |
·基于讨论区的共识学习方法 | 第112-114页 |
·应用实例 | 第114-117页 |
§5.3 本章小结 | 第117-119页 |
第六章 应用实例 | 第119-128页 |
§6.1 军事应用背景 | 第119-120页 |
§6.2 案例描述 | 第120-122页 |
·作战想定 | 第120页 |
·理论准备 | 第120-122页 |
·案例中的协同学习 | 第122页 |
§6.3 仿真实验的过程 | 第122-124页 |
§6.4 实验结果 | 第124-127页 |
§6.5 本章小结 | 第127-128页 |
第七章 总结与展望 | 第128-131页 |
§7.1 主要工作与创新 | 第128-130页 |
§7.2 进一步的工作 | 第130-131页 |
致谢 | 第131-133页 |
参考文献 | 第133-140页 |
附录A 作者攻读博士学位期间发表的学术论文 | 第140-142页 |
附录B 作者攻读博士学位期间参加的科研项目 | 第142页 |