首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

联合博弈框架下的多Agent强化学习算法研究

摘要第1-4页
ABSTRACT第4-8页
第一章 绪论第8-12页
   ·研究目的及意义第8-9页
   ·协商框架研究现状第9页
   ·强化学习研究现状第9-10页
   ·论文研究的主要内容及创新点第10-11页
   ·论文整体结构第11-12页
第二章 相关理论研究第12-24页
   ·强化学习理论研究第12-14页
   ·多Agent 强化学习基本理论第14-16页
     ·多Agent 强化学习基本模型第14-15页
     ·多Agent 学习系统的组成要素第15-16页
   ·多AGENT 强化学习的主要算法第16-20页
     ·动态规划方法第16-17页
     ·时间差分算法第17页
     ·Q 学习算法第17-20页
     ·基于角色跟踪的强化学习算法第20页
   ·强化学习算法分析第20-22页
     ·学习率α对强化学习算法的影响第20-21页
     ·学习策略对强化学习算法的影响第21-22页
   ·本章小结第22-24页
第三章 多Agent 协商模型框架第24-38页
   ·理论基础第24页
   ·双边多议题自治协商模型第24-29页
     ·BNM 的形式化描述第24-25页
     ·效用评价机制-K第25页
     ·学习机制—L第25-26页
     ·提议策略-S第26-29页
   ·协商模型优化设计第29-34页
     ·协商协议第29-31页
     ·僵局消解过程算法设计第31-32页
     ·基于Q 学习的僵局消解设计第32-34页
   ·算法分析第34-37页
     ·实验场景描述第35页
     ·可收敛性第35-36页
     ·有效性第36-37页
   ·本章小结第37-38页
第四章 基于联合博弈的多Agent 强化学习第38-50页
   ·多AGENT 协作学习的联合博弈框架第38-43页
     ·基本概念第38-40页
     ·基于联合博弈的多Agent 强化学习算法第40-42页
     ·算法实现第42-43页
   ·调度问题的描述第43-49页
     ·任务调度问题的研究现状分析第44-45页
     ·协同设计任务调度问题描述第45-46页
     ·应用实例与分析第46-49页
   ·本章小结第49-50页
第五章 总结与展望第50-52页
   ·论文总结第50页
   ·进一步工作第50-52页
参考文献第52-56页
致谢第56-57页
攻读学位期间发表的学术论文目录第57-58页

论文共58页,点击 下载论文
上一篇:混合通信模式下的群机器人搜索问题研究
下一篇:面向对象方法在PLC程序设计中的应用研究