首页--经济论文--经济计划与管理论文--经济计算、经济数学方法论文--经济数学方法论文--运筹学在经济中的应用论文--博弈论论文

多agent协作团队的学习方法研究

摘要第1-13页
ABSTRACT第13-15页
第一章 绪论第15-38页
 §1.1 研究背景第15-18页
 §1.2 多agent学习概述第18-25页
     ·多agent系统第19-20页
     ·多agent学习的研究内容第20-22页
     ·多agent学习的研究现状第22-25页
 §1.3 多agent强化学习概述第25-35页
     ·多agent强化学习的相关研究领域第25-27页
     ·强化学习的理论基础第27-34页
       ·马尔可夫决策过程第28-29页
       ·最优行为模型第29-30页
       ·探索与利用的关系第30-31页
       ·强化学习的主要算法第31-34页
     ·多agent强化学习的研究现状第34-35页
 §1.4 本文的结构第35-38页
第二章 多agent协作求解过程研究第38-64页
 §2.1 多agent协作模型概述第38-39页
 §2.2 多agent协作求解框架第39-48页
     ·多agent协作团队第39-42页
     ·理性BDI模型第42-45页
     ·承诺和约定第45-47页
     ·多agent协作求解的过程第47-48页
 §2.3 多agent系统开发平台MBOS第48-62页
     ·MBOS简介第48-49页
     ·AGENTFRAME结构第49-52页
     ·会话管理的实现第52-62页
       ·交互协议的制定第53-56页
       ·交互协议的状态转换第56-59页
       ·交互协议的消息处理第59-62页
 §2.4 协作和学习的关系第62-63页
 §2.5 本章小结第63-64页
第三章 共享经验元组的多agent协同强化学习第64-84页
 §3.1 角色分配第64-71页
     ·角色分配的要求第65-66页
     ·多agent协作团队的偶图表示第66-67页
     ·基于偶图的角色分配算法第67-71页
     ·角色分配的优化第71页
 §3.2 Q学习算法第71-74页
     ·评估函数的确立第71-72页
     ·Q值的更新第72-74页
 §3.3 多agent协同强化学习算法SE-MACOL第74-80页
     ·问题域描述第74-77页
     ·状态行为空间的缩减第77-78页
     ·共享经验元组第78-80页
 §3.4 实验及结果分析第80-83页
 §3.5 本章小结第83-84页
第四章 基于团队马尔可夫博弈的多agent协同强化学习第84-106页
 §4.1 引言第84-85页
 §4.2 马尔可夫博弈第85-88页
     ·博弈论第85-86页
     ·矩阵博弈第86页
     ·马尔可夫博弈第86-88页
 §4.3 多agent协同强化学习算法TMG-MACOL第88-100页
     ·相关定义第88-91页
     ·问题域描述第91-93页
     ·阶段博弈的结果评估第93-95页
     ·虚拟行动过程第95-97页
     ·TMG-MACOL算法第97-100页
 §4.4 实验及结果分析第100-105页
 §4.5 本章小结第105-106页
第五章 改进团队协作性能的其他学习方法第106-119页
 §5.1 确定团队的结构及其学习第106-111页
     ·基于案例的推理第107-108页
     ·案例的结构设计第108-109页
     ·基于模糊理论的相似性计算第109-111页
 §5.2 确定团队的运作过程及其学习第111-117页
     ·方法的提出第111-112页
     ·基于讨论区的共识学习方法第112-114页
     ·应用实例第114-117页
 §5.3 本章小结第117-119页
第六章 应用实例第119-128页
 §6.1 军事应用背景第119-120页
 §6.2 案例描述第120-122页
     ·作战想定第120页
     ·理论准备第120-122页
     ·案例中的协同学习第122页
 §6.3 仿真实验的过程第122-124页
 §6.4 实验结果第124-127页
 §6.5 本章小结第127-128页
第七章 总结与展望第128-131页
 §7.1 主要工作与创新第128-130页
 §7.2 进一步的工作第130-131页
致谢第131-133页
参考文献第133-140页
附录A 作者攻读博士学位期间发表的学术论文第140-142页
附录B 作者攻读博士学位期间参加的科研项目第142页

论文共142页,点击 下载论文
上一篇:英汉语篇衔接手段的差异与翻译策略
下一篇:战略联盟的企业文化效应