深度强化学习在图像辅助控制及图像分类中的应用研究

摘要	第5-6页
Abstract	第6页
第一章绪论	第10-15页
1.1 研究背景	第10-11页
1.2 研究目标及意义	第11-13页
1.3 本文主要内容及贡献	第13页
1.4 本文结构	第13-15页
第二章相关研究工作回顾	第15-32页
2.1 强化学习	第15-19页
2.1.1 强化学习的设置	第15-17页
2.1.2 经典算法	第17-18页
2.1.3 Actor-Critic结构	第18-19页
2.2 深度学习	第19-25页
2.2.1 研究进展	第19-21页
2.2.2 训练优化	第21-23页
2.2.3 DenseNet和mlpconv层	第23-25页
2.3 深度强化学习	第25-31页
2.3.1 新一代智能系统	第26-27页
2.3.2 DQN和DDPG	第27-30页
2.3.3 多任务或层次性算法以及在计算机视觉中的应用	第30-31页
2.4 本章小结	第31-32页
第三章连续动作空间中的多任务学习	第32-44页
3.1 算法结构	第32-34页
3.2 算法流程	第34-36页
3.3 实验与结果	第36-42页
3.3.1 实验设置	第36-38页
3.3.2 多任务学习性能	第38-41页
3.3.3 与失败策略一同训练	第41-42页
3.4 本章小结	第42-44页
第四章连续动作空间中的层次性学习	第44-59页
4.1 算法结构	第44-46页
4.2 算法流程	第46-47页
4.3 算法设计细节	第47-49页
4.3.1 正回报与负回报	第47-48页
4.3.2 记忆重现和批抽样	第48页
4.3.3 探索	第48-49页
4.4 实验与结果	第49-57页
4.4.1 实验设置	第49-52页
4.4.2 基值网络性能	第52-53页
4.4.3 元值网络性能	第53-55页
4.4.4 与失败策略一同训练	第55-56页
4.4.5 与其他方法对比	第56-57页
4.5 本章小结	第57-59页
第五章自强化图像分类模型	第59-69页
5.1 算法结构	第59-62页
5.1.1 图像分类网络	第60-61页
5.1.2 特征决策智能系统	第61-62页
5.2 算法流程	第62-64页
5.3 实验与结果	第64-67页
5.3.1 实验设置	第64-66页
5.3.2 分类准确率	第66-67页
5.3.3 智能系统性能	第67页
5.4 本章小结	第67-69页
总结与展望	第69-71页
参考文献	第71-78页
附录攻读硕士学位期间完成的其他工作	第78-84页
A 区分手写体和印刷体以及DropRegion算法	第78-80页
B 语言和手写印刷体分类的多任务训练	第80-82页
附录中引用的参考文献	第82-84页
攻读硕士学位期间取得的研究成果	第84-85页
致谢	第85-86页
附件	第86页