致谢 | 第4-5页 |
摘要 | 第5-7页 |
Abstract | 第7-8页 |
1 引言 | 第15-22页 |
1.1 课题研究的背景和意义 | 第15-16页 |
1.1.1 课题研究的背景 | 第15-16页 |
1.1.2 课题研究的意义 | 第16页 |
1.2 研究内容 | 第16-19页 |
1.2.1 少样本词文本识别 | 第17页 |
1.2.2 多通道词文本识别 | 第17-18页 |
1.2.3 场景端到端文本识别 | 第18页 |
1.2.4 论文研究内容之间的联系 | 第18-19页 |
1.3 主要贡献 | 第19-20页 |
1.3.1 基于二值标签编码网络的少样本词文本识别 | 第19页 |
1.3.2 基于深度卷积神经网络集成的多通道词文本识别 | 第19-20页 |
1.3.3 基于识别反馈机制的端到端文本识别 | 第20页 |
1.4 论文内容的组织结构 | 第20-22页 |
2 复杂场景文本识别研究综述 | 第22-47页 |
2.1 复杂场景文本识别研究现状 | 第22-30页 |
2.1.1 复杂场景文本图像特点 | 第23-26页 |
2.1.2 词文本识别技术研究现状 | 第26-28页 |
2.1.3 端到端识别系统研究现状 | 第28-30页 |
2.2 文本图像特征表示 | 第30-35页 |
2.2.1 手写体文本图像特征表示 | 第31-32页 |
2.2.2 自然场景文本图像特征表示 | 第32-33页 |
2.2.3 基于深度学习的文本图像特征表示 | 第33-35页 |
2.3 识别结果标签编码 | 第35页 |
2.4 识别模型构建 | 第35-41页 |
2.4.1 基于字符图像建模的识别模型 | 第35-38页 |
2.4.2 基于局部区域建模的识别模型 | 第38-39页 |
2.4.3 基于整词图像建模的识别模型 | 第39-41页 |
2.5 文本区域定位 | 第41-46页 |
2.5.1 基于纹理的文本区域定位 | 第41-43页 |
2.5.2 基于连通域的文本区域定位 | 第43-45页 |
2.5.3 基于层次结构的文本区域定位 | 第45-46页 |
2.6 识别的后处理 | 第46页 |
2.7 本章小结 | 第46-47页 |
3 基于二值标签编码网络的少样本词文本识别 | 第47-66页 |
3.1 算法概述 | 第47-56页 |
3.1.1 整体框架 | 第47-48页 |
3.1.2 基于深度卷积神经网络的特征提取 | 第48-51页 |
3.1.3 基于迭代量化方法的二值标签编码 | 第51-54页 |
3.1.4 基于核典型相关分析的相关匹配 | 第54-56页 |
3.2 实验验证 | 第56-65页 |
3.2.1 数据集和评价标准 | 第56-57页 |
3.2.2 手写体文本识别实验 | 第57-58页 |
3.2.3 不同特征提取方法对识别性能的影响 | 第58-60页 |
3.2.4 不同二值标签编码对识别结果的影响 | 第60-64页 |
3.2.5 不同相关匹配方法对识别性能的影响 | 第64-65页 |
3.3 本章小结 | 第65-66页 |
4 基于深度卷积神经网络集成的多通道词文本识别 | 第66-89页 |
4.1 算法概述 | 第67-79页 |
4.1.1 整体框架和模型集成 | 第67-68页 |
4.1.2 基于通道扩展的深度卷积神经网络文本识别 | 第68-71页 |
4.1.3 基于深度卷积神经网络文本识别 | 第71-75页 |
4.1.4 深度卷积神经网络集成 | 第75-77页 |
4.1.5 深度卷积神经网络文本识别结果扩展 | 第77-79页 |
4.2 实验验证 | 第79-88页 |
4.2.1 数据集和评价标准 | 第79-80页 |
4.2.2 自然场景文本识别实验 | 第80-82页 |
4.2.3 不同通道组合对识别性能的影响 | 第82-84页 |
4.2.4 不同识别模型对识别性能的影响 | 第84-86页 |
4.2.5 识别扩展对识别性能的影响 | 第86-88页 |
4.3 本章小结 | 第88-89页 |
5 基于识别反馈机制的端到端文本识别 | 第89-111页 |
5.1 算法概述 | 第90-100页 |
5.1.1 基于检测-识别反馈机制的通用框架 | 第90-94页 |
5.1.2 基于局部编辑距离匹配的内容校正算法 | 第94-97页 |
5.1.3 基于识别反馈机制的端到端文本识别模型 | 第97-98页 |
5.1.4 词文本区域粗定位 | 第98页 |
5.1.5 基于拟合模型的词文本区域精定位 | 第98-100页 |
5.1.6 基于字符序列建模的非最大值抑制算法 | 第100页 |
5.2 实验验证 | 第100-110页 |
5.2.1 数据集和评测标准 | 第101-102页 |
5.2.2 自然场景端到端文本识别实验 | 第102-107页 |
5.2.3 不同粗定位模型对识别性能的影响 | 第107-108页 |
5.2.4 不同内容校正模型对识别性能的影响 | 第108-109页 |
5.2.5 不同词典大小对识别性能的影响 | 第109-110页 |
5.3 本章小结 | 第110-111页 |
6 结论 | 第111-113页 |
参考文献 | 第113-123页 |
作者简历及在学研究成果 | 第123-126页 |
学位论文数据集 | 第126页 |