基于深度强化学习在游戏上的应用

摘要	第6-8页
abstract	第8-9页
第1章绪论	第12-19页
1.1 研究背景及意义	第12-13页
1.2 研究现状	第13-17页
1.2.1 深度学习研究现状	第13-15页
1.2.2 强化学习研究现状	第15-17页
1.3 论文研究内容和组织结构	第17-19页
第2章深度学习	第19-30页
2.1 人工神经网络结构	第19-23页
2.2 深度学习	第23-24页
2.3 卷积神经网络	第24-28页
2.3.1 卷积神经网络的分层思想	第25页
2.3.2 卷积神经网络结构	第25-28页
2.4 循环神经网络	第28-30页
第3章强化学习	第30-39页
3.1 强化学习原理	第30-35页
3.1.1 马尔科夫决策过程(MARKOVDECISIONPROCESS,MDP)	第31-33页
3.1.2 策略迭代和值迭代	第33-35页
3.2 Q-LEARNING算法	第35-37页
3.3 OPENAIGYM测试平台	第37-39页
第4章深度强化学习	第39-56页
4.1 Q值神经网络化	第40-41页
4.2 DQN算法及优化	第41-43页
4.3 DQN在游戏中存在的问题	第43-47页
4.3.1 针对过高估计问题的分析研究	第44-47页
4.4 数据预处理和网络结构设计	第47-51页
4.5 DOUBLEDQN仿真分析	第51-56页
第5章模型融合的深度强化学习及算法对比	第56-61页
5.1 模型融合的深度强化学习	第56-58页
5.2 不同的算法比较	第58-61页
结论	第61-62页
参考文献	第62-67页
攻读硕士学位期间发表的论文和取得的科研成果	第67-68页
致谢	第68-69页