基于蒙特卡罗树搜索的计算机扑克程序

摘要	第4-5页
ABSTRACT	第5-6页
第一章绪论	第9-12页
1.1 研究背景	第9页
1.2 课题研究内容	第9-10页
1.3 课题意义	第10页
1.4 论文结构	第10-12页
第二章德州扑克	第12-21页
2.1 德克萨斯扑克	第12-15页
2.1.1 德州扑克的起源与现状	第12页
2.1.2 德州扑克的游戏规则	第12-14页
2.1.3 德州扑克的打牌规则	第14-15页
2.2 德州扑克的特性描述	第15-18页
2.2.1 德州扑克的博弈特性	第15-17页
2.2.2 德州扑克的问题复杂度	第17-18页
2.3 相关研究	第18-20页
2.3.1 基于博弈论理论的研究	第18-19页
2.3.2 基于领域知识的研究	第19页
2.3.3 基于博弈树的研究	第19-20页
2.4 本章小结	第20-21页
第三章传统蒙特卡罗树搜索	第21-28页
3.1 博弈树理论	第21-22页
3.2 蒙特卡罗树搜索算法	第22-24页
3.2.1 蒙特卡罗方法	第22-23页
3.2.2 蒙特卡罗树搜索	第23-24页
3.3 基于UCT策略的蒙特卡罗树搜索算法	第24-27页
3.3.1 UCB1策略	第25-26页
3.3.2 博弈树的信息上限UCT策略	第26-27页
3.4 本章小结	第27-28页
第四章基于德州扑克的蒙特卡罗树搜索	第28-45页
4.1 基于德州扑克的博弈树构造	第28-32页
4.1.1 博弈树节点的设计	第28-30页
4.1.2 节点状态的转移	第30-32页
4.2 博弈树节点的蒙特卡罗模拟	第32-34页
4.2.1 叶子节点的蒙特卡罗模拟	第32页
4.2.2 决策节点以及对手节点的蒙特卡罗模拟	第32-33页
4.2.3 随机节点的蒙特卡罗模拟	第33-34页
4.3 博弈树节点的更新回溯以及选择策略	第34-37页
4.3.1 叶子节点的更新回溯策略	第34-35页
4.3.2 随机节点的回溯与选择策略	第35页
4.3.3 决策节点的回溯与选择策略	第35-36页
4.3.4 对手节点的回溯与选择策略	第36-37页
4.4 博弈引擎的设计与实现	第37-44页
4.4.1 博弈树节点的构造	第37-39页
4.4.2 蒙特卡罗树搜索的设计与实现	第39-42页
4.4.3 博弈引擎的设计与实现	第42-44页
4.5 本章小结	第44-45页
第五章领域知识的集成	第45-53页
5.1 Buckting底牌提取	第45-47页
5.2 基于统计的对手模型	第47-50页
5.3 翻牌前的策略积极化	第50-52页
5.4 本章小结	第52-53页
第六章实验与结果分析	第53-56页
6.1 实验设计与结果分析	第53-55页
6.2 本章小结	第55-56页
第七章总结与展望	第56-58页
参考文献	第58-60页
致谢	第60-61页
攻读学位期间发表的学术论文	第61页