首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于深度强化学习的3D游戏的非完备信息机器博弈研究

摘要第4-5页
ABSTRACT第5-6页
第1章 绪论第9-15页
    1.1 课题研究背景和意义第9-11页
        1.1.1 课题研究背景第9-10页
        1.1.2 研究的目的和意义第10-11页
    1.2 国内外相关研究及综述第11-13页
    1.3 主要研究内容及组织结构第13-15页
        1.3.1 主要研究内容第13-14页
        1.3.2 论文的组织结构第14-15页
第2章 非完备信息机器博弈第15-31页
    2.1 非完备信息游戏中的博弈问题第15-16页
    2.2 估值函数第16-17页
        2.2.1 静态估值函数第16页
        2.2.2 动态估值函数第16-17页
    2.3 部分可观测马尔科夫决策过程第17-19页
    2.4 深度强化学习第19-30页
        2.4.1 强化学习第19-23页
        2.4.2 深度学习第23-25页
        2.4.3 深度强化学习算法第25-30页
    2.5 本章小结第30-31页
第3章 基于深度强化学习的非完备信息机器博弈第31-48页
    3.1 改进的深度强化学习网络第31-43页
        3.1.1 长短期记忆模型LSTM第31-37页
        3.1.2 双重Q学习第37-39页
        3.1.3 基于优先级搜索的记忆回放第39-43页
    3.2 可视化强化学习研究平台Vizdoom第43-45页
    3.3 基于改进深度强化学习算法的Vizdoom3D游戏博弈第45-47页
    3.4 本章小结第47-48页
第4章 Vizdoom游戏的系统实现和实验分析第48-58页
    4.1 Vizdoom游戏系统第48-52页
        4.1.1 Vizdoom游戏系统框架第48页
        4.1.2 改进的深度强化学习网络结构第48-49页
        4.1.3 Vizdoom游戏训练方式及参数设置第49-52页
    4.2 实验结果对比与分析第52-57页
        4.2.1 基本场景中算法时效性与平均Q值对比第52-53页
        4.2.2 生存困境场景中智能体生存能力对比第53-54页
        4.2.3 守护亚典娜场景中智能体生存能力对比第54-56页
        4.2.4 死亡对战场景智能体对战能力对比第56-57页
    4.3 本章小结第57-58页
结论第58-60页
参考文献第60-66页
致谢第66页

论文共66页,点击 下载论文
上一篇:小样本条件下的遥感图像分类方法研究
下一篇:基于深度学习的视频主角衣服检测与检索方法研究