基于全卷积神经网络的自然场景文字检测方法研究
摘要 | 第4-5页 |
Abstract | 第5-6页 |
第一章 绪论 | 第9-19页 |
1.1 课题研究背景与意义 | 第9-11页 |
1.2 国内外研究现状 | 第11-16页 |
1.2.1 基于滑动窗口的检测算法 | 第11-12页 |
1.2.2 基于联合区域的检测算法 | 第12-14页 |
1.2.3 基于深度学习的检测算法 | 第14-16页 |
1.3 文字检测难点分析 | 第16-17页 |
1.4 本文研究内容与章节安排 | 第17-19页 |
第二章 自然场景文字检测算法基础 | 第19-30页 |
2.1 通用深度学习网络算法 | 第19-21页 |
2.1.1 深度学习检测网络算法 | 第19-20页 |
2.1.2 深度学习分割网络算法 | 第20-21页 |
2.2 全卷积神经网络介绍(FCN) | 第21-22页 |
2.3 基于深度图和分割图像的文字检测数据合成 | 第22-29页 |
2.3.1 获取场景深度图 | 第23-25页 |
2.3.2 获取场景分割图 | 第25-26页 |
2.3.3 文字合成 | 第26-29页 |
2.4 本章小结 | 第29-30页 |
第三章 基于边缘信息的文字区域粗提取 | 第30-45页 |
3.1 全景图矫正 | 第30-32页 |
3.2 图像预处理 | 第32-37页 |
3.2.1 兴趣区域提取 | 第32-33页 |
3.2.2 图像去噪 | 第33页 |
3.2.3 图像增强 | 第33-37页 |
3.3 灰度边缘检测 | 第37-42页 |
3.3.1 边缘梯度检测 | 第37-39页 |
3.3.2 边缘密度检测 | 第39-40页 |
3.3.3 轮廓线检测 | 第40-42页 |
3.4 非文字区域粗过滤 | 第42-43页 |
3.5 本章小结 | 第43-45页 |
第四章 基于全卷积神经网络的文字检测 | 第45-56页 |
4.1 多任务文字检测网络 | 第45-52页 |
4.1.1 网络结构设计 | 第45-48页 |
4.1.2 候选区域生成 | 第48-51页 |
4.1.3 损失函数设计 | 第51-52页 |
4.2 网络训练 | 第52-53页 |
4.3 局部非极大值抑制去伪文字 | 第53-55页 |
4.4 本章小结 | 第55-56页 |
第五章 文字检测实验分析与评价 | 第56-82页 |
5.1 数据库介绍和评价标准 | 第56-59页 |
5.1.1 数据集介绍 | 第56-58页 |
5.1.2 评价标准 | 第58-59页 |
5.2 图像合成质量评价 | 第59-62页 |
5.3 标准数据集检测结果分析 | 第62-73页 |
5.4 全景影像检测结果分析 | 第73-81页 |
5.5 本章小结 | 第81-82页 |
第六章 总结与展望 | 第82-85页 |
6.1 研究总结 | 第82-83页 |
6.2 未来展望 | 第83-85页 |
参考文献 | 第85-90页 |
攻读硕士期间科研经历与科研成果 | 第90-91页 |
致谢 | 第91-92页 |