首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于虚拟遗憾最小化算法的德州扑克机器博弈研究

摘要第4-5页
ABSTRACT第5-6页
第1章 绪论第9-17页
    1.1 课题背景及意义第9-11页
        1.1.1 课题研究背景第9-10页
        1.1.2 研究的目的和意义第10-11页
    1.2 国内外相关技术研究现状第11-15页
        1.2.1 机器博弈大事记第11-12页
        1.2.2 国外研究现状第12-14页
        1.2.3 国内研究现状第14-15页
    1.3 主要研究内容和组织结构第15-17页
        1.3.1 主要研究内容第15-16页
        1.3.2 论文的组织结构第16-17页
第2章 机器博弈基本理论第17-25页
    2.1 正则博弈和扩展式博弈第17-18页
    2.2 信息集第18-19页
    2.3 纳什均衡和劣策略第19-20页
    2.4 Kuhn扑克第20-22页
        2.4.1 Kuhn扑克游戏规则第20-21页
        2.4.2 3-Kuhn扑克游戏状态空间复杂度分析第21-22页
    2.5 德州扑克第22-24页
        2.5.1 德州扑克游戏规则第22页
        2.5.2 德州扑克博弈特性第22-23页
        2.5.3 德州扑克状态空间复杂度分析第23-24页
    2.6 本章小结第24-25页
第3章 虚拟遗憾最小化算法研究第25-42页
    3.1 遗憾最小化算法第25-27页
        3.1.1 遗憾最小化(Regret Minimization)第25-26页
        3.1.2 遗憾匹配(Regret Matching)第26-27页
    3.2 虚拟遗憾最小化算法(CFR)第27-30页
    3.3 蒙特卡罗虚拟遗憾最小化算法(MCCFR)第30-34页
        3.3.1 基于随机抽样的蒙特卡罗虚拟遗憾最小化算法第31-32页
        3.3.2 基于外部抽样的蒙特卡罗虚拟遗憾最小化算法第32-34页
    3.4 纯虚拟遗憾最小化算法(Pure CFR)第34-35页
    3.5 一种改进的虚拟遗憾最小化算法(CFR+)第35-36页
    3.6 虚拟遗憾最小化算法的德州扑克决策模型第36-41页
        3.6.1 德州扑克状态空间抽象第36-38页
        3.6.2 离线学习对手策略的虚拟遗憾最小化算法第38-39页
        3.6.3 在线自适应对手策略的虚拟遗憾最小化算法第39-41页
    3.7 本章小结第41-42页
第4章 实验与结果分析第42-53页
    4.1 实验系统结构第42-47页
        4.1.1 德州扑克机器博弈系统实现的七个阶段第42-45页
        4.1.2 德州扑克机器博弈系统框架第45-47页
    4.2 实验数据的搜集与整理第47-48页
    4.3 实验结果分析第48-52页
        4.3.1 算法性能分析第48-51页
        4.3.2 改进的CFR算法在3人Kuhn扑克游戏中的应用第51页
        4.3.3 改进的CFR算法在德州扑克游戏中的应用第51-52页
    4.4 本章小结第52-53页
结论第53-55页
参考文献第55-60页
附录第60-65页
    附录A 德州扑克游戏第60-62页
        A.1 牌型分类第60-61页
        A.2 德州扑克不同玩法第61-62页
    附录B 计算机德州扑克大赛第62-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:一种面向移动端的适应性文件推送系统的设计与实现
下一篇:司法审判视角下的大气污染防治