基于深度学习的目标检测和定位的研究
摘要 | 第4-5页 |
Abstract | 第5页 |
1 绪论 | 第8-13页 |
1.1 研究的背景 | 第8-9页 |
1.2 与课题相关的研究现状 | 第9-11页 |
1.3 论文的主要工作 | 第11页 |
1.4 论文的主体结构 | 第11-13页 |
2 相关技术的研究 | 第13-36页 |
2.1 图像分割技术 | 第13-20页 |
2.1.1 选择性搜索算法 | 第14-18页 |
2.1.2 边缘盒检测算法 | 第18-20页 |
2.2 深度学习的相关理论 | 第20-35页 |
2.3 本章小结 | 第35-36页 |
3 目标检测和定位技术分析 | 第36-44页 |
3.1 基于深度学习技术的特征提取 | 第36-41页 |
3.1.1 图像的高维特征表达 | 第36-39页 |
3.1.2 图像卷积操作的相关特征 | 第39-41页 |
3.2 估计目标网络在图像分割上的应用 | 第41-43页 |
3.2.1 估计目标网络 | 第42-43页 |
3.3 本章小结 | 第43-44页 |
4 神经网络模型的设计 | 第44-54页 |
4.1 激活函数的设计 | 第44-46页 |
4.1.1 传统激活函数 | 第44-45页 |
4.1.2 指数线性单元 | 第45-46页 |
4.2 卷积核和池化层的设计 | 第46-49页 |
4.2.1 图像卷积核的设计 | 第46页 |
4.2.2 VGGNet基本结构 | 第46-48页 |
4.2.3 Atrons算法 | 第48-49页 |
4.3 模型的相关原理介绍 | 第49-53页 |
4.3.1 默认框和高宽比的确定 | 第50页 |
4.3.2 模型中默认框的生成规则 | 第50-52页 |
4.3.3 模型训练目标函数 | 第52-53页 |
4.4 本章小结 | 第53-54页 |
5 目标检测与定位的系统实现 | 第54-73页 |
5.1 总体结构设计 | 第54-55页 |
5.2 系统实现的环境 | 第55-56页 |
5.3 训练数据集 | 第56-59页 |
5.3.1 数据集的预处理 | 第57-59页 |
5.3.2 模型训练集和测试集列表的生成 | 第59页 |
5.4 CUDA基础介绍 | 第59-65页 |
5.4.1 GPU硬件组织方式 | 第60-61页 |
5.4.2 CUDA中的运行单元 | 第61-62页 |
5.4.3 GPU内存结构 | 第62页 |
5.4.4 基于CUDA的C/C++编程 | 第62-65页 |
5.5 Caffe框架的使用 | 第65-67页 |
5.6 神经网络的实现 | 第67-68页 |
5.7 模型搭建的步骤 | 第68-69页 |
5.8 神经网络模型的训练 | 第69-72页 |
5.9 本章小结 | 第72-73页 |
6 目标检测和定位实现 | 第73-78页 |
6.1 测试集的准备 | 第73页 |
6.2 模型的功能测试 | 第73-75页 |
6.2.1 测试的样例 | 第73-75页 |
6.2.2 测试结论 | 第75页 |
6.3 模型性能测试 | 第75-77页 |
6.3.1 KITTI数据集测试 | 第75-77页 |
6.4 本章小结 | 第77-78页 |
结论 | 第78-79页 |
参考文献 | 第79-82页 |
致谢 | 第82-83页 |