首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于深度强化学习的非完备信息机器博弈研究

摘要第4-5页
ABSTRACT第5-6页
第1章 绪论第9-15页
    1.1 课题研究背景和意义第9-11页
        1.1.1 课题研究背景第9-10页
        1.1.2 研究的目的和意义第10-11页
    1.2 国内外相关研究及综述第11-13页
    1.3 主要研究内容及组织结构第13-15页
        1.3.1 主要研究内容第13-14页
        1.3.2 论文的组织结构第14-15页
第2章 非完备信息机器博弈第15-21页
    2.1 非完备信息游戏中的博弈问题第15页
    2.2 博弈树搜索第15-17页
    2.3 估值函数第17-18页
        2.3.1 静态估值函数第17页
        2.3.2 动态估值函数第17-18页
    2.4 部分可观测马尔科夫决策过程第18-20页
    2.5 本章小结第20-21页
第3章 基于深度强化学习的非完备信息机器博弈第21-43页
    3.1 深度强化学习第21-29页
        3.1.1 强化学习第21-24页
        3.1.2 深度学习第24-25页
        3.1.3 深度强化学习算法第25-29页
    3.2 改进的深度强化学习网络第29-33页
    3.3 基于蒙特卡洛博弈树搜索的回报函数第33-37页
        3.3.1 蒙特卡洛博弈树搜索第33-35页
        3.3.2 蒙特卡洛博弈树搜索应用于深度强化学习中第35-37页
    3.4 扑克游戏的模式匹配建模方法第37-42页
    3.5 本章小结第42-43页
第4章 非完备信息机器博弈系统的实现和实验分析第43-53页
    4.1 德州扑克机器博弈系统第43-48页
        4.1.1 德州扑克机器博弈系统框架第43-45页
        4.1.2 德州扑克智能体训练方式第45-46页
        4.1.3 改进的深度强化学习网络结构第46-48页
    4.2 实验结果分析第48-52页
        4.2.1 两种网络效果对比第48-50页
        4.2.2 不同梯度下降算法实验效果对比第50页
        4.2.3 改进的深度强化学习智能体与其他智能体对比第50-52页
    4.3 本章小结第52-53页
结论第53-55页
参考文献第55-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:基于多特征融合的卫星遥感图像分类研究
下一篇:高光谱图像数据分布式分类处理方法研究