深度增强学习的改进研究

摘要	第5-6页
ABSTRACT	第6页
第一章绪论	第8-14页
1.1 研究背景	第8-9页
1.2 国内外研究现状	第9-12页
1.3 研究目标与研究内容	第12-13页
1.3.1 研究目标	第12页
1.3.2 研究内容	第12-13页
1.4 本文的组织结构	第13-14页
第二章预备知识	第14-20页
2.1 马尔科夫决策过程与增强学习	第14-16页
2.2 Q学习算法	第16-17页
2.3 DQN算法	第17-20页
第三章基于传播加速的改进方法	第20-26页
3.1 Q学习算法与动态规划	第20-22页
3.2 基于传播加速的改进方法	第22-25页
3.3 本章小结	第25-26页
第四章基于前置状态优先级调整的改进方法	第26-32页
4.1 基于优先级抽样的DQN算法	第26-29页
4.2 基于前置状态优先级调整的改进方法	第29-31页
4.3 本章小结	第31-32页
第五章实验分析与系统设计	第32-47页
5.1 实验软硬件环境	第32-35页
5.2 实验结果与分析	第35-46页
5.2.1 PDQN与PDDQN算法实验结果与分析	第36-43页
5.2.2 DQN-RePER与DDQN-RePER算法实验结果与分析	第43-46页
5.3 本章小结	第46-47页
第六章总结与展望	第47-49页
6.1 研究工作总结	第47页
6.2 研究工作展望	第47-49页
致谢	第49-50页
参考文献	第50-53页
作者简介	第53页