首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于A3C模型的带预判游戏智能体研究

摘要第4-5页
ABSTRACT第5页
第1章 绪论第8-17页
    1.1 课题研究的背景和意义第8-10页
    1.2 国内外相关研究及分析第10-15页
        1.2.1 国内外研究现状第10-14页
        1.2.2 国内外研究的问题简析第14-15页
    1.3 本文主要研究内容第15-16页
    1.4 本文内容安排第16-17页
第2章 深度强化学习与研究环境介绍第17-36页
    2.1 深度学习及其原理第17-28页
        2.1.1 感知机与神经网络第17-22页
        2.1.2 卷积神经网络基本组件及其作用第22-28页
    2.2 强化学习和马尔科夫决策过程第28-30页
    2.3 图像预测第30-32页
    2.4 研究工具和平台介绍第32-35页
        2.4.1 Tensorflow框架介绍第32-33页
        2.4.2 VizDoom游戏平台介绍第33-35页
    2.5 本章小结第35-36页
第3章 基于A3C的带预判游戏智能体第36-46页
    3.1 研究内容概述第36页
    3.2 强化学习和DQN原理第36-39页
    3.3 Actor-Critic与A3C模型的原理第39-41页
    3.4 Anticipator-A3C模型基本思想第41-45页
        3.4.1 Anticipator-A3C模型总体结构第41-45页
        3.4.2 Anticipator模块原理第45页
    3.5 本章小结第45-46页
第4章 模型设计实现与实验第46-57页
    4.1 模型的网络结构与实现细节第46-52页
        4.1.1 模型结构设计与参数设置第46-50页
        4.1.2 模型训练过程分析第50-52页
    4.2 实验环境与条件设置第52页
    4.3 实验结果及分析第52-56页
    4.4 本章小结第56-57页
结论第57-59页
参考文献第59-63页
攻读硕士学位期间发表的论文及其它成果第63-65页
致谢第65页

论文共65页,点击 下载论文
上一篇:熔石英损伤修复流程基准标识定位及损伤评定研究
下一篇:义齿数控加工轨迹优化及其前瞻速度控制算法研究