基于虚拟遗憾最小化算法的德州扑克机器博弈研究

摘要	第4-5页
ABSTRACT	第5-6页
第1章绪论	第9-17页
1.1 课题背景及意义	第9-11页
1.1.1 课题研究背景	第9-10页
1.1.2 研究的目的和意义	第10-11页
1.2 国内外相关技术研究现状	第11-15页
1.2.1 机器博弈大事记	第11-12页
1.2.2 国外研究现状	第12-14页
1.2.3 国内研究现状	第14-15页
1.3 主要研究内容和组织结构	第15-17页
1.3.1 主要研究内容	第15-16页
1.3.2 论文的组织结构	第16-17页
第2章机器博弈基本理论	第17-25页
2.1 正则博弈和扩展式博弈	第17-18页
2.2 信息集	第18-19页
2.3 纳什均衡和劣策略	第19-20页
2.4 Kuhn扑克	第20-22页
2.4.1 Kuhn扑克游戏规则	第20-21页
2.4.2 3-Kuhn扑克游戏状态空间复杂度分析	第21-22页
2.5 德州扑克	第22-24页
2.5.1 德州扑克游戏规则	第22页
2.5.2 德州扑克博弈特性	第22-23页
2.5.3 德州扑克状态空间复杂度分析	第23-24页
2.6 本章小结	第24-25页
第3章虚拟遗憾最小化算法研究	第25-42页
3.1 遗憾最小化算法	第25-27页
3.1.1 遗憾最小化(Regret Minimization)	第25-26页
3.1.2 遗憾匹配(Regret Matching)	第26-27页
3.2 虚拟遗憾最小化算法(CFR)	第27-30页
3.3 蒙特卡罗虚拟遗憾最小化算法(MCCFR)	第30-34页
3.3.1 基于随机抽样的蒙特卡罗虚拟遗憾最小化算法	第31-32页
3.3.2 基于外部抽样的蒙特卡罗虚拟遗憾最小化算法	第32-34页
3.4 纯虚拟遗憾最小化算法(Pure CFR)	第34-35页
3.5 一种改进的虚拟遗憾最小化算法(CFR+)	第35-36页
3.6 虚拟遗憾最小化算法的德州扑克决策模型	第36-41页
3.6.1 德州扑克状态空间抽象	第36-38页
3.6.2 离线学习对手策略的虚拟遗憾最小化算法	第38-39页
3.6.3 在线自适应对手策略的虚拟遗憾最小化算法	第39-41页
3.7 本章小结	第41-42页
第4章实验与结果分析	第42-53页
4.1 实验系统结构	第42-47页
4.1.1 德州扑克机器博弈系统实现的七个阶段	第42-45页
4.1.2 德州扑克机器博弈系统框架	第45-47页
4.2 实验数据的搜集与整理	第47-48页
4.3 实验结果分析	第48-52页
4.3.1 算法性能分析	第48-51页
4.3.2 改进的CFR算法在3人Kuhn扑克游戏中的应用	第51页
4.3.3 改进的CFR算法在德州扑克游戏中的应用	第51-52页
4.4 本章小结	第52-53页
结论	第53-55页
参考文献	第55-60页
附录	第60-65页
附录A 德州扑克游戏	第60-62页
A.1 牌型分类	第60-61页
A.2 德州扑克不同玩法	第61-62页
附录B 计算机德州扑克大赛	第62-65页
致谢	第65页