首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

不确定环境下Agent长期联盟形成问题研究

摘要第1-6页
Abstract第6-8页
目录第8-10页
第一章 绪论第10-19页
   ·引言第10-12页
   ·研究现状第12-16页
     ·联盟形成算法第13页
     ·解概念的计算可行性第13页
     ·多agent系统中联盟问题的其他方面第13-16页
   ·本文工作及论文组织结构第16-19页
     ·本文工作第16-18页
     ·本文的组织结构第18-19页
第二章 背景介绍第19-30页
   ·重复博弈第19页
   ·随机博弈第19-20页
   ·贝叶斯博弈第20页
   ·强化学习及其主要算法第20-25页
     ·马尔可夫过程第20-21页
     ·动态规划方法第21-23页
     ·模型无关的算法第23-25页
   ·贝叶斯强化学习第25-27页
     ·模型无关的贝叶斯强化学习算法第25-27页
   ·正态分布的共轭分布及贝叶斯估计第27-30页
第三章 基于贝叶斯强化学习的动态联盟形成机制第30-47页
   ·引言第30页
   ·一般的合作博弈模型第30-32页
   ·基于联盟的任务分配问题第32-33页
   ·相关工作第33-34页
   ·基于贝叶斯的联盟形成算法第34-38页
     ·不确定环境下的联盟形成问题第34-35页
     ·对agent能力的建模及共轭先验概率第35-38页
   ·模型求解第38-43页
     ·强化学习第38-40页
     ·基于贝叶斯强化学习的联盟形成机制第40-43页
   ·动态联盟形成第43页
   ·实验第43-46页
     ·实验设置第43-45页
     ·实验结果及分析第45-46页
   ·本章小结第46-47页
第四章 基于学习方法的重复博弈的联盟机制框架第47-57页
   ·引言第47-48页
   ·背景和相关工作第48-50页
     ·联盟形成第48-49页
     ·相关工作第49-50页
   ·重复博弈下的联盟形成第50-53页
   ·实验与结果第53-56页
     ·联盟形成算法第53-54页
     ·确定相似度阈值第54-56页
   ·本章小结第56-57页
第五章 总结与展望第57-59页
   ·本文工作总结第57-58页
   ·下一步工作展望第58-59页
参考文献第59-64页
附录第64-65页
致谢第65-66页

论文共66页,点击 下载论文
上一篇:利用隐式约束的机器学习方法研究
下一篇:基于DBN的汇率预测研究