摘要 | 第3-4页 |
abstract | 第4-5页 |
第一章 绪论 | 第10-16页 |
1.1 研究背景与意义 | 第10页 |
1.2 相关研究的国内外现状 | 第10-13页 |
1.2.1 图像游戏智能体自主游戏背景 | 第11页 |
1.2.2 深度学习背景 | 第11-12页 |
1.2.3 深度强化学习背景 | 第12-13页 |
1.3 论文的主要工作 | 第13-14页 |
1.4 论文组织结构 | 第14-16页 |
第二章 深度与强化学习算法分析 | 第16-31页 |
2.1 深度学习算法分析研究 | 第16-25页 |
2.1.1 深度学习的基本思想与训练过程 | 第16-17页 |
2.1.2 神经网络 | 第17-21页 |
2.1.2.1 人工神经网络单元 | 第17-18页 |
2.1.2.2 激活函数 | 第18-20页 |
2.1.2.3 神经网络结构 | 第20-21页 |
2.1.3 卷积神经网络 | 第21-25页 |
2.1.3.1 卷积神经网络原理分析 | 第21-24页 |
2.1.3.2 卷积神经网络训练结构 | 第24-25页 |
2.2 强化学习算法分析研究 | 第25-30页 |
2.2.1 强化学习原理 | 第25-26页 |
2.2.1.1 强化学习与监督学习和非监督学习 | 第25-26页 |
2.2.1.2 强化学习原理分析 | 第26页 |
2.2.2 马尔科夫决策过程 | 第26-29页 |
2.2.3 值迭代与策略迭代 | 第29-30页 |
2.3 本章小结 | 第30-31页 |
第三章 图像游戏分析研究 | 第31-41页 |
3.1 图像游戏分析介绍 | 第31-34页 |
3.1.1 图像游戏发展现状 | 第31-32页 |
3.1.2 强化学习应用于图像游戏 | 第32-34页 |
3.1.2.1 应用强化学习的图像游戏发展 | 第32页 |
3.1.2.2 强化学习Q-Learning算法 | 第32-34页 |
3.2 用于图像游戏的深度Q学习与经验重放算法 | 第34-40页 |
3.2.1 深度Q学习结合随机经验重放算法 | 第34-37页 |
3.2.1.1 深度Q学习结合随机经验重放算法分析 | 第34-35页 |
3.2.1.2 深度Q学习结合随机经验重放算法实现 | 第35-37页 |
3.2.2 深度Q学习结合传统优先经验重放算法 | 第37-40页 |
3.2.2.1 深度Q学习结合传统优先经验重放算法分析 | 第37-38页 |
3.2.2.2 深度Q学习结合传统优先经验重放算法实现 | 第38-40页 |
3.3 本章小结 | 第40-41页 |
第四章 改进深度Q学习优先经验重放算法 | 第41-50页 |
4.1 深度强化学习算法分析 | 第41-43页 |
4.1.1 深度强化学习背景分析 | 第41-42页 |
4.1.2 深度强化学习中的梯度下降算法 | 第42-43页 |
4.2 改进深度Q学习优先经验重放算法分析研究 | 第43-49页 |
4.2.1 深度Q学习 | 第43-45页 |
4.2.2 改进深度Q学习优先经验重放算法分析 | 第45-46页 |
4.2.3 改进深度Q学习优先经验重放算法实现 | 第46-49页 |
4.3 本章小结 | 第49-50页 |
第五章 实验及结果分析 | 第50-64页 |
5.1 实验软硬件环境 | 第50-51页 |
5.2 实验方案设计 | 第51-55页 |
5.2.1 实验软件程序架构 | 第51-53页 |
5.2.2 实验方案设计 | 第53-55页 |
5.3 实验结果分析 | 第55-63页 |
5.3.1 改进算法的直观模型策略分析 | 第55-56页 |
5.3.2 各算法CNN网络层数架构选择 | 第56-58页 |
5.3.3 各算法代价函数分析 | 第58-60页 |
5.3.4 各算法效率分析 | 第60-62页 |
5.3.5 各算法游戏分数对比 | 第62-63页 |
5.4 本章小结 | 第63-64页 |
总结与展望 | 第64-66页 |
1.总结 | 第64页 |
2.展望 | 第64-66页 |
参考文献 | 第66-70页 |
附录 | 第70-74页 |
致谢 | 第74-76页 |
攻读学位期间发表的学术论文目录 | 第76-77页 |