基于强化学习的目标检测算法研究

摘要	第5-6页
ABSTRACT	第6-7页
第1章绪论	第10-16页
1.1 论文研究的背景及意义	第10-11页
1.2 目标检测技术的国内外研究现状	第11-14页
1.2.1 基于传统方法的目标检测算法	第11-12页
1.2.2 基于深度学习的目标检测算法	第12-13页
1.2.3 基于深度强化学习的目标检测算法	第13-14页
1.3 本文的主要内容和结构	第14-16页
第2章深度强化学习基础	第16-31页
2.1 强化学习	第16-21页
2.1.1 强化学习组成部分	第17-18页
2.1.1.1 策略	第17页
2.1.1.2 奖赏	第17-18页
2.1.1.3 价值函数	第18页
2.1.1.4 环境模型	第18页
2.1.2 马尔可夫决策过程	第18-21页
2.2 深度学习	第21-25页
2.2.1 神经元	第21-22页
2.2.2 误差反向传播算法	第22-24页
2.2.3 深度学习	第24-25页
2.3 深度强化学习	第25-30页
2.3.1 深度学习与强化学习的结合	第25-26页
2.3.2 DQN模型	第26-30页
2.4 本章小结	第30-31页
第3章联合边框回归的深度强化学习目标检测算法	第31-39页
3.1 引言	第31页
3.2 联合回归网络的深度强化学习目标检测	第31-35页
3.2.1 MDP建模	第32-34页
3.2.2 损失函数	第34页
3.2.3 模型训练	第34-35页
3.3 实验及结果分析	第35-38页
3.3.1 实验平台及参数设定	第35页
3.3.2 实验结果与分析	第35-38页
3.4 本章小结	第38-39页
第4章基于多层特征与深度强化学习目标检测算法	第39-51页
4.1 引言	第39-40页
4.2 多层特征提取	第40-41页
4.3 强化学习建模	第41-42页
4.3.1 行动	第41-42页
4.3.2 状态	第42页
4.3.3 奖赏	第42页
4.4 深度强化学习与多层特征的融合	第42-46页
4.4.1 改进的经验池	第43页
4.4.2 目标函数	第43-44页
4.4.3 模型架构	第44-46页
4.5 实验仿真及结果分析	第46-49页
4.5.1 实验平台及参数设定	第46页
4.5.2 实验结果	第46-48页
4.5.3 误差分析	第48-49页
4.6 本章小结	第49-51页
第5章总结与展望	第51-53页
5.1 总结	第51-52页
5.2 展望	第52-53页
致谢	第53-54页
参考文献	第54-58页
附录	第58页