首页--数理科学和化学论文--运筹学论文--对策论(博弈论)论文

在多Agent环境中求帕累托效率解的方法研究

摘要第1-4页
ABSTRACT第4-6页
目录第6-9页
第一章 绪论第9-14页
   ·研究背景第9页
   ·研究现状第9-12页
   ·研究内容第12-13页
   ·论文结构及主要内容第13-14页
第二章 多AGENT学习理论综述第14-23页
   ·AGENT的概念及特征第14-17页
     ·Agent的定义第14-15页
     ·Agent的特征第15-16页
     ·多Agent系统第16-17页
   ·MAS学习框架理论模型第17-21页
     ·马尔科夫决策过程(Markov Decision Processes,MDP)第17-18页
     ·矩阵博弈(Matrix Games)第18-19页
     ·随机博弈(Stochastic Games)第19-20页
     ·MAS学习框架小结第20-21页
   ·学习算法相关定义第21-23页
第三章 一种在多AGENT系统中求帕累托高效率解的方法第23-32页
   ·Q-学习第23-25页
     ·Q-学习原理第23页
     ·Q-学习算法的描述第23-25页
   ·WoLF思想及其相关算法第25-26页
     ·WoLF原理第25页
     ·Winning的判定第25-26页
   ·ROBERT AXELROD实验第26-27页
   ·PESCO算法第27-32页
     ·PESCO算法的核心策略第27-29页
       ·符号的定义第28页
       ·博弈策略的判定第28页
       ·策略的选定第28-29页
       ·Q值的计算第29页
     ·PESCO算法的描述第29-32页
第四章 博弈实验与分析第32-50页
   ·实验一:供零博弈第32-41页
     ·供零博弈第32-33页
     ·自博弈第33-34页
     ·不同的对手第34-39页
       ·Q合作对手、对抗对手与TfT第34-36页
       ·Random第36-37页
       ·Q-学习第37-38页
       ·WoLF-PHC第38-39页
       ·WoLF-GIGA第39页
     ·各个Agent的博弈结果第39-41页
     ·结论第41页
   ·STACKELBERG博弈第41-45页
     ·Stackelberg第41-42页
     ·自博弈第42-43页
     ·各个Agent博弈结果第43-45页
   ·猜硬币博弈第45-49页
     ·猜硬币博弈第45-46页
     ·自博弈第46页
     ·对抗WoLF-GIGA算法第46-47页
     ·各个Agent博弈结果第47-49页
   ·小结第49-50页
第五章 总结与展望第50-52页
   ·总结第50页
   ·未来工作展望第50-52页
参考文献第52-56页
致谢第56-57页
附录(攻读学位期间发表的论文)第57页

论文共57页,点击 下载论文
上一篇:城市照明远程监控系统的开发及应用
下一篇:一种改进的Web社区挖掘算法