基于卷积神经网络的场景文本定位及多方向字符识别研究
| 摘要 | 第4-6页 |
| ABSTRACT | 第6-7页 |
| 中英文缩写对照表 | 第11-12页 |
| 1 绪论 | 第12-31页 |
| 1.1 研究背景及意义 | 第12-14页 |
| 1.2 场景文本研究的难点 | 第14-18页 |
| 1.3 国内外研究现状 | 第18-26页 |
| 1.4 本文的研究内容 | 第26-28页 |
| 1.5 本文的结构安排 | 第28-31页 |
| 2 场景文本研究数据库及评价标准 | 第31-37页 |
| 2.1 场景文本定位和识别相关数据库 | 第31-34页 |
| 2.2 场景文本定位算法评价标准 | 第34-36页 |
| 2.3 场景文本识别算法评价标准 | 第36页 |
| 2.4 本章小结 | 第36-37页 |
| 3 基于卷积神经网络的场景文本定位方法 | 第37-64页 |
| 3.1 引言 | 第37-39页 |
| 3.2 场景文本定位算法框架 | 第39页 |
| 3.3 三层结构场景文本定位算法 | 第39-55页 |
| 3.4 实验结果与分析 | 第55-62页 |
| 3.5 本章小结 | 第62-64页 |
| 4 基于卷积神经网络与场景上下文的文本定位方法 | 第64-92页 |
| 4.1 引言 | 第64-66页 |
| 4.2 结合上下文的场景文本定位算法框架 | 第66-67页 |
| 4.3 基于场景上下文辅助文本定位的方法 | 第67-80页 |
| 4.4 实验结果和分析 | 第80-90页 |
| 4.5 本章小结 | 第90-92页 |
| 5 基于纹理和结构特征联合的多方向字符识别方法 | 第92-107页 |
| 5.1 引言 | 第92-94页 |
| 5.2 多方向字符识别算法框架 | 第94-95页 |
| 5.3 字符特征表达 | 第95-96页 |
| 5.4 多方向字符识别模型 | 第96-98页 |
| 5.5 实验结果及分析 | 第98-106页 |
| 5.6 本章小结 | 第106-107页 |
| 6 全文总结与工作展望 | 第107-111页 |
| 6.1 本文工作总结 | 第107-108页 |
| 6.2 未来工作展望 | 第108-111页 |
| 致谢 | 第111-113页 |
| 参考文献 | 第113-126页 |
| 附录1 攻读博士学位期间发表的主要论文 | 第126-127页 |
| 附录2 博士学位论文与博士期间发表论文的关系 | 第127-128页 |
| 附录3 攻读博士学位期间参与的项目 | 第128页 |