基于虚拟遗憾最小化算法的非完备信息机器博弈研究
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第1章 绪论 | 第9-16页 |
1.1 课题背景及意义 | 第9-11页 |
1.1.1 课题研究背景 | 第9-10页 |
1.1.2 研究的目的和意义 | 第10-11页 |
1.2 非完备信息机器博弈国内外研究现状 | 第11-14页 |
1.2.1 国外研究现状 | 第11-13页 |
1.2.2 国内研究现状 | 第13-14页 |
1.3 主要研究内容和组织结构 | 第14-16页 |
1.3.1 主要研究内容 | 第14页 |
1.3.2 论文的组织结构 | 第14-16页 |
第2章 非完备信息机器博弈 | 第16-27页 |
2.1 引言 | 第16页 |
2.2 非完备信息机器博弈问题分类 | 第16-17页 |
2.3 扩展式博弈模型 | 第17-20页 |
2.3.1 博弈树与扩展式博弈模型 | 第17-19页 |
2.3.2 策略 | 第19-20页 |
2.4 博弈论解概念 | 第20-22页 |
2.4.1 最佳反应 | 第20页 |
2.4.2 纳什均衡 | 第20页 |
2.4.3 极大极小值定理 | 第20-21页 |
2.4.4 可利用度 | 第21页 |
2.4.5 解概念分析比较 | 第21-22页 |
2.5 扑克规则介绍 | 第22-24页 |
2.5.1 德州扑克 | 第22-24页 |
2.5.2 Kuhn扑克 | 第24页 |
2.6 计算纳什均衡策略的算法 | 第24-26页 |
2.7 本章小结 | 第26-27页 |
第3章 基于CFR算法的两方非完备信息机器博弈 | 第27-42页 |
3.1 引言 | 第27页 |
3.2 遗憾匹配与遗憾最小化 | 第27-29页 |
3.3 CFR算法流程 | 第29-37页 |
3.3.1 整体遗憾与平均策略 | 第29-30页 |
3.3.2 虚拟遗憾值的计算 | 第30-31页 |
3.3.3 最小化即时遗憾值的方法 | 第31-33页 |
3.3.4 CFR算法界限 | 第33-34页 |
3.3.5 CFR算法实例 | 第34-37页 |
3.4 在线CFR算法 | 第37-41页 |
3.5 本章小结 | 第41-42页 |
第4章 基于CFR算法的三方非完备信息机器博弈 | 第42-54页 |
4.1 引言 | 第42页 |
4.2 CFR算法应用在多人博弈中的问题 | 第42-43页 |
4.3 算法收敛性证明 | 第43-53页 |
4.4 在线CFR算法 | 第53页 |
4.5 本章小结 | 第53-54页 |
第5章 实验与结果分析 | 第54-65页 |
5.1 引言 | 第54页 |
5.2 设计与实现 | 第54-60页 |
5.2.1 实验对象选择 | 第54页 |
5.2.2 系统结构设计 | 第54-56页 |
5.2.3 博弈智能体构建框架 | 第56页 |
5.2.4 两人非限制性德州扑克智能体实现 | 第56-58页 |
5.2.5 三人Kuhn扑克实现 | 第58-60页 |
5.3 实验结果与分析 | 第60-64页 |
5.3.1 两人非限制性德州扑克 | 第60-62页 |
5.3.2 三人Kuhn扑克 | 第62-64页 |
5.4 本章小结 | 第64-65页 |
结论 | 第65-66页 |
参考文献 | 第66-74页 |
致谢 | 第74页 |