首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

用于图像游戏的深度强化学习改进算法研究

摘要第3-4页
abstract第4-5页
第一章 绪论第10-16页
    1.1 研究背景与意义第10页
    1.2 相关研究的国内外现状第10-13页
        1.2.1 图像游戏智能体自主游戏背景第11页
        1.2.2 深度学习背景第11-12页
        1.2.3 深度强化学习背景第12-13页
    1.3 论文的主要工作第13-14页
    1.4 论文组织结构第14-16页
第二章 深度与强化学习算法分析第16-31页
    2.1 深度学习算法分析研究第16-25页
        2.1.1 深度学习的基本思想与训练过程第16-17页
        2.1.2 神经网络第17-21页
            2.1.2.1 人工神经网络单元第17-18页
            2.1.2.2 激活函数第18-20页
            2.1.2.3 神经网络结构第20-21页
        2.1.3 卷积神经网络第21-25页
            2.1.3.1 卷积神经网络原理分析第21-24页
            2.1.3.2 卷积神经网络训练结构第24-25页
    2.2 强化学习算法分析研究第25-30页
        2.2.1 强化学习原理第25-26页
            2.2.1.1 强化学习与监督学习和非监督学习第25-26页
            2.2.1.2 强化学习原理分析第26页
        2.2.2 马尔科夫决策过程第26-29页
        2.2.3 值迭代与策略迭代第29-30页
    2.3 本章小结第30-31页
第三章 图像游戏分析研究第31-41页
    3.1 图像游戏分析介绍第31-34页
        3.1.1 图像游戏发展现状第31-32页
        3.1.2 强化学习应用于图像游戏第32-34页
            3.1.2.1 应用强化学习的图像游戏发展第32页
            3.1.2.2 强化学习Q-Learning算法第32-34页
    3.2 用于图像游戏的深度Q学习与经验重放算法第34-40页
        3.2.1 深度Q学习结合随机经验重放算法第34-37页
            3.2.1.1 深度Q学习结合随机经验重放算法分析第34-35页
            3.2.1.2 深度Q学习结合随机经验重放算法实现第35-37页
        3.2.2 深度Q学习结合传统优先经验重放算法第37-40页
            3.2.2.1 深度Q学习结合传统优先经验重放算法分析第37-38页
            3.2.2.2 深度Q学习结合传统优先经验重放算法实现第38-40页
    3.3 本章小结第40-41页
第四章 改进深度Q学习优先经验重放算法第41-50页
    4.1 深度强化学习算法分析第41-43页
        4.1.1 深度强化学习背景分析第41-42页
        4.1.2 深度强化学习中的梯度下降算法第42-43页
    4.2 改进深度Q学习优先经验重放算法分析研究第43-49页
        4.2.1 深度Q学习第43-45页
        4.2.2 改进深度Q学习优先经验重放算法分析第45-46页
        4.2.3 改进深度Q学习优先经验重放算法实现第46-49页
    4.3 本章小结第49-50页
第五章 实验及结果分析第50-64页
    5.1 实验软硬件环境第50-51页
    5.2 实验方案设计第51-55页
        5.2.1 实验软件程序架构第51-53页
        5.2.2 实验方案设计第53-55页
    5.3 实验结果分析第55-63页
        5.3.1 改进算法的直观模型策略分析第55-56页
        5.3.2 各算法CNN网络层数架构选择第56-58页
        5.3.3 各算法代价函数分析第58-60页
        5.3.4 各算法效率分析第60-62页
        5.3.5 各算法游戏分数对比第62-63页
    5.4 本章小结第63-64页
总结与展望第64-66页
    1.总结第64页
    2.展望第64-66页
参考文献第66-70页
附录第70-74页
致谢第74-76页
攻读学位期间发表的学术论文目录第76-77页

论文共77页,点击 下载论文
上一篇:BP神经网络算法在微波解冻保鲜装置的应用研究
下一篇:六自由度机械臂避障路径规划研究