MAS环境下Agent学习的博弈策略研究

摘要	第1-4页
ABSTRACT	第4-6页
目录	第6-8页
第一章绪论	第8-14页
·研究背景	第8-9页
·研究现状	第9-11页
·研究内容	第11-12页
·论文结构及主要内容	第12-14页
第二章多AGENT学习理论综述	第14-24页
·AGENT的概念及特征	第14-18页
·Agent的定义	第14-16页
·多Agent系统的特性及应用	第16-18页
·MAS学习框架理论模型	第18-21页
·马尔科夫决策过程(Markov Decision Processes,MDP)	第18页
·矩阵博弈(Matrix Games)	第18-20页
·随机博弈(Stochastic Games)	第20-21页
·MAS学习框架小结	第21页
·学习算法的属性	第21-24页
第三章 MAS中AGENF学习的策略分析及算法研究	第24-36页
·博弈策略的动态性分析	第24-31页
·IGA(Infinitesimal Gradient Ascent)分析	第24-27页
·IGA中策略的性质	第27-29页
·IGA中策略性质的实验验证	第29-31页
·IGA算法的改造	第31-34页
·多AGENT学习算法的分类	第34-36页
第四章竞争环境中学习算法的预检测机制	第36-50页
·EXPLOITERWT算法	第36-39页
·两人两动作博弈的实验与分析	第39-43页
·ExploiterWT算法对抗固定策略	第39-40页
·ExploiterWT算法对抗PHC算法	第40-41页
·ExploiterWT算法自博弈	第41-42页
·ExploiterWT算法对抗WoLF-PHC算法	第42-43页
·两人三动作博弈的实验与分析	第43-49页
·ExploiterWT算法对抗固定策略	第44-45页
·ExploiterWT算法对抗PHC算法	第45-46页
·ExploiterWT算法自博弈	第46-47页
·ExploiterWT算法对抗WoLF-PHC算法	第47-49页
·小结	第49-50页
第五章总结与展望	第50-52页
·总结	第50页
·未来工作展望	第50-52页
参考文献	第52-56页
致谢	第56-57页
附录 (攻读学位期间发表的论文)	第57页