首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于虚拟遗憾最小化算法的非完备信息机器博弈研究

摘要第4-5页
ABSTRACT第5-6页
第1章 绪论第9-16页
    1.1 课题背景及意义第9-11页
        1.1.1 课题研究背景第9-10页
        1.1.2 研究的目的和意义第10-11页
    1.2 非完备信息机器博弈国内外研究现状第11-14页
        1.2.1 国外研究现状第11-13页
        1.2.2 国内研究现状第13-14页
    1.3 主要研究内容和组织结构第14-16页
        1.3.1 主要研究内容第14页
        1.3.2 论文的组织结构第14-16页
第2章 非完备信息机器博弈第16-27页
    2.1 引言第16页
    2.2 非完备信息机器博弈问题分类第16-17页
    2.3 扩展式博弈模型第17-20页
        2.3.1 博弈树与扩展式博弈模型第17-19页
        2.3.2 策略第19-20页
    2.4 博弈论解概念第20-22页
        2.4.1 最佳反应第20页
        2.4.2 纳什均衡第20页
        2.4.3 极大极小值定理第20-21页
        2.4.4 可利用度第21页
        2.4.5 解概念分析比较第21-22页
    2.5 扑克规则介绍第22-24页
        2.5.1 德州扑克第22-24页
        2.5.2 Kuhn扑克第24页
    2.6 计算纳什均衡策略的算法第24-26页
    2.7 本章小结第26-27页
第3章 基于CFR算法的两方非完备信息机器博弈第27-42页
    3.1 引言第27页
    3.2 遗憾匹配与遗憾最小化第27-29页
    3.3 CFR算法流程第29-37页
        3.3.1 整体遗憾与平均策略第29-30页
        3.3.2 虚拟遗憾值的计算第30-31页
        3.3.3 最小化即时遗憾值的方法第31-33页
        3.3.4 CFR算法界限第33-34页
        3.3.5 CFR算法实例第34-37页
    3.4 在线CFR算法第37-41页
    3.5 本章小结第41-42页
第4章 基于CFR算法的三方非完备信息机器博弈第42-54页
    4.1 引言第42页
    4.2 CFR算法应用在多人博弈中的问题第42-43页
    4.3 算法收敛性证明第43-53页
    4.4 在线CFR算法第53页
    4.5 本章小结第53-54页
第5章 实验与结果分析第54-65页
    5.1 引言第54页
    5.2 设计与实现第54-60页
        5.2.1 实验对象选择第54页
        5.2.2 系统结构设计第54-56页
        5.2.3 博弈智能体构建框架第56页
        5.2.4 两人非限制性德州扑克智能体实现第56-58页
        5.2.5 三人Kuhn扑克实现第58-60页
    5.3 实验结果与分析第60-64页
        5.3.1 两人非限制性德州扑克第60-62页
        5.3.2 三人Kuhn扑克第62-64页
    5.4 本章小结第64-65页
结论第65-66页
参考文献第66-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:基于Agent的微信移动社交平台恶意代码传播模型
下一篇:基于用户—词语表示联合学习的情感分析方法