| 摘要 | 第5-7页 |
| Abstract | 第7-9页 |
| 目录 | 第10-12页 |
| 第1章 绪论 | 第12-22页 |
| 1.1 文字检测研究及意义 | 第12-17页 |
| 1.2 文字检测问题难点分析 | 第17-19页 |
| 1.3 基于用户意图(User-intention)的文字检测 | 第19-20页 |
| 1.4 本文主要工作 | 第20页 |
| 1.5 本文结构安排 | 第20-22页 |
| 第2章 文字检测技术概述 | 第22-30页 |
| 2.1 全自动的文字检测技术概述 | 第22-28页 |
| 2.1.1 基于区域的文字检测算法 | 第23-24页 |
| 2.1.2 基于连通区域的文字检测算法 | 第24-28页 |
| 2.1.3 基于前两种方法融合的方法 | 第28页 |
| 2.2 基于用户意图的文字检测技术概述 | 第28-29页 |
| 2.3 小结 | 第29-30页 |
| 第3章 自然场景图像中的全自动文字检测 | 第30-85页 |
| 3.1 引言 | 第30-41页 |
| 3.1.1 候选连通区域提取难点分析及解决思路 | 第30-32页 |
| 3.1.2 文字/非文字分类难点分析及解决思路 | 第32-41页 |
| 3.2 神经网络简介 | 第41-46页 |
| 3.2.1 一般前馈神经网络简介 | 第41-44页 |
| 3.2.2 Dropout算法 | 第44页 |
| 3.2.3 本文参数设置 | 第44-46页 |
| 3.3 本文解决方案 | 第46-75页 |
| 3.3.1 系统概述 | 第46-47页 |
| 3.3.2 颜色空间变换 | 第47-50页 |
| 3.3.3 Color-enhanced CER提取 | 第50-58页 |
| 3.3.4 文字/非文字分类 | 第58-75页 |
| 3.3.5 后处理 | 第75页 |
| 3.3.6 多通道结果融合 | 第75页 |
| 3.4 实验结果 | 第75-82页 |
| 3.4.1 系统的总体结果评测 | 第76-81页 |
| 3.4.2 系统主要模块的结果评测 | 第81-82页 |
| 3.5 算法局限性 | 第82-83页 |
| 3.6 算法讨论 | 第83-84页 |
| 3.7 本章小结 | 第84-85页 |
| 第4章 基于用户意图的文字检测 | 第85-94页 |
| 4.1 文献[23]中的算法 | 第85-89页 |
| 4.2 改进算法 | 第89-91页 |
| 4.3 实验结果 | 第91-93页 |
| 4.4 本章小结 | 第93-94页 |
| 第5章 总结与展望 | 第94-97页 |
| 5.1 本文工作总结 | 第94-95页 |
| 5.2 未来研究展望 | 第95-97页 |
| 插图索引 | 第97-100页 |
| 表格索引 | 第100-101页 |
| 参考文献 | 第101-111页 |
| 致谢 | 第111-113页 |
| 攻读博士学位期间的研究成果 | 第113页 |