基于A3C模型的带预判游戏智能体研究

摘要	第4-5页
ABSTRACT	第5页
第1章绪论	第8-17页
1.1 课题研究的背景和意义	第8-10页
1.2 国内外相关研究及分析	第10-15页
1.2.1 国内外研究现状	第10-14页
1.2.2 国内外研究的问题简析	第14-15页
1.3 本文主要研究内容	第15-16页
1.4 本文内容安排	第16-17页
第2章深度强化学习与研究环境介绍	第17-36页
2.1 深度学习及其原理	第17-28页
2.1.1 感知机与神经网络	第17-22页
2.1.2 卷积神经网络基本组件及其作用	第22-28页
2.2 强化学习和马尔科夫决策过程	第28-30页
2.3 图像预测	第30-32页
2.4 研究工具和平台介绍	第32-35页
2.4.1 Tensorflow框架介绍	第32-33页
2.4.2 VizDoom游戏平台介绍	第33-35页
2.5 本章小结	第35-36页
第3章基于A3C的带预判游戏智能体	第36-46页
3.1 研究内容概述	第36页
3.2 强化学习和DQN原理	第36-39页
3.3 Actor-Critic与A3C模型的原理	第39-41页
3.4 Anticipator-A3C模型基本思想	第41-45页
3.4.1 Anticipator-A3C模型总体结构	第41-45页
3.4.2 Anticipator模块原理	第45页
3.5 本章小结	第45-46页
第4章模型设计实现与实验	第46-57页
4.1 模型的网络结构与实现细节	第46-52页
4.1.1 模型结构设计与参数设置	第46-50页
4.1.2 模型训练过程分析	第50-52页
4.2 实验环境与条件设置	第52页
4.3 实验结果及分析	第52-56页
4.4 本章小结	第56-57页
结论	第57-59页
参考文献	第59-63页
攻读硕士学位期间发表的论文及其它成果	第63-65页
致谢	第65页