基于状态抽象和残局解算的二人非限制性德州扑克策略的研究

摘要	第4-5页
ABSTRACT	第5-6页
第1章绪论	第9-15页
1.1 课题研究背景及意义	第9-13页
1.1.1 课题研究背景	第9-10页
1.1.2 研究目的和意义	第10-11页
1.1.3 国内外研究现状	第11-13页
1.2 主要研究内容和组织结构	第13-15页
1.2.1 主要研究内容	第13-14页
1.2.2 论文的组织结构	第14-15页
第2章非完备信息机器博弈	第15-24页
2.1 引言	第15页
2.2 德州扑克游戏规则	第15-16页
2.3 德州扑克状态空间	第16-17页
2.4 机器博弈基本概念	第17-18页
2.5 博弈论解概念	第18-20页
2.5.1 策略的表示	第18-19页
2.5.2 纳什均衡	第19-20页
2.6 遗憾最小化算法	第20-21页
2.7 虚拟遗憾最小化算法	第21-23页
2.8 本章小结	第23-24页
第3章状态抽象算法	第24-38页
3.1 引言	第24页
3.2 手牌同构算法	第24-27页
3.2.1 对点数集合M?rank建立索引	第25-26页
3.2.2 对K轮点数集组建立索引	第26页
3.2.3 结合花色建立最终索引	第26-27页
3.3 手牌抽象算法	第27-33页
3.3.1 基于手牌分布的手牌抽象	第27-30页
3.3.2 基于公共信息的手牌抽象	第30-32页
3.3.3 基于对手手牌类型的手牌抽象	第32-33页
3.4 动作抽象算法	第33-35页
3.5 动作映射算法	第35-37页
3.6 本章小结	第37-38页
第4章游戏残局解算	第38-47页
4.1 引言	第38页
4.2 策略实时求解框架	第38-41页
4.3 对手手牌预测	第41-42页
4.4 中间状态效益值估计	第42-44页
4.5 CFR~+算法	第44-46页
4.6 高效叶子结点收益评估	第46页
4.7 本章小结	第46-47页
第5章德州扑克智能体的设计与实现	第47-57页
5.1 引言	第47页
5.2 智能体设计与实现	第47-49页
5.2.1 博弈系统框架	第47-48页
5.2.2 智能体框架	第48-49页
5.3 实验结果与分析	第49-54页
5.3.1 手牌同构算法对比实验	第49页
5.3.2 抽象算法对比实验	第49-50页
5.3.3 游戏残局对比实验	第50-51页
5.3.4 动作抽象的对比实验	第51-52页
5.3.5 参加ACPC比赛结果	第52-54页
5.4 基于Web的德州扑克人机对弈系统	第54-56页
5.5 本章小结	第56-57页
结论	第57-58页
参考文献	第58-63页
攻读硕士学位期间发表的论文及其他成果	第63-65页
致谢	第65页