首页--数理科学和化学论文--运筹学论文--对策论(博弈论)论文

基于状态抽象和残局解算的二人非限制性德州扑克策略的研究

摘要第4-5页
ABSTRACT第5-6页
第1章 绪论第9-15页
    1.1 课题研究背景及意义第9-13页
        1.1.1 课题研究背景第9-10页
        1.1.2 研究目的和意义第10-11页
        1.1.3 国内外研究现状第11-13页
    1.2 主要研究内容和组织结构第13-15页
        1.2.1 主要研究内容第13-14页
        1.2.2 论文的组织结构第14-15页
第2章 非完备信息机器博弈第15-24页
    2.1 引言第15页
    2.2 德州扑克游戏规则第15-16页
    2.3 德州扑克状态空间第16-17页
    2.4 机器博弈基本概念第17-18页
    2.5 博弈论解概念第18-20页
        2.5.1 策略的表示第18-19页
        2.5.2 纳什均衡第19-20页
    2.6 遗憾最小化算法第20-21页
    2.7 虚拟遗憾最小化算法第21-23页
    2.8 本章小结第23-24页
第3章 状态抽象算法第24-38页
    3.1 引言第24页
    3.2 手牌同构算法第24-27页
        3.2.1 对点数集合M?rank建立索引第25-26页
        3.2.2 对K轮点数集组建立索引第26页
        3.2.3 结合花色建立最终索引第26-27页
    3.3 手牌抽象算法第27-33页
        3.3.1 基于手牌分布的手牌抽象第27-30页
        3.3.2 基于公共信息的手牌抽象第30-32页
        3.3.3 基于对手手牌类型的手牌抽象第32-33页
    3.4 动作抽象算法第33-35页
    3.5 动作映射算法第35-37页
    3.6 本章小结第37-38页
第4章 游戏残局解算第38-47页
    4.1 引言第38页
    4.2 策略实时求解框架第38-41页
    4.3 对手手牌预测第41-42页
    4.4 中间状态效益值估计第42-44页
    4.5 CFR~+算法第44-46页
    4.6 高效叶子结点收益评估第46页
    4.7 本章小结第46-47页
第5章 德州扑克智能体的设计与实现第47-57页
    5.1 引言第47页
    5.2 智能体设计与实现第47-49页
        5.2.1 博弈系统框架第47-48页
        5.2.2 智能体框架第48-49页
    5.3 实验结果与分析第49-54页
        5.3.1 手牌同构算法对比实验第49页
        5.3.2 抽象算法对比实验第49-50页
        5.3.3 游戏残局对比实验第50-51页
        5.3.4 动作抽象的对比实验第51-52页
        5.3.5 参加ACPC比赛结果第52-54页
    5.4 基于Web的德州扑克人机对弈系统第54-56页
    5.5 本章小结第56-57页
结论第57-58页
参考文献第58-63页
攻读硕士学位期间发表的论文及其他成果第63-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:基于扰动补偿的无人艇路径跟踪控制算法研究
下一篇:大气层外飞行器多目标分配与带约束末制导律研究