首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

面向自然场景的端对端英文文字识别研究

摘要第4-5页
Abstract第5-6页
第一章 绪论第11-25页
    1.1 研究背景及意义第11-12页
    1.2 相关技术及研究现状第12-22页
        1.2.1 文档图像分析第13-15页
        1.2.2 自然场景文字识别面临的挑战第15-18页
        1.2.3 研究现状第18-22页
    1.3 本文的主要研究内容第22页
    1.4 文章的结构安排第22-25页
第二章 字符的特征表示与分类第25-47页
    2.1 自然场景文字的特点第25-26页
    2.2 基于卷积神经网络的字符特征的层次化表示第26-31页
        2.2.1 无监督学习第27-30页
        2.2.2 基于卷积神经网络的特征提取第30-31页
    2.3 基于梯度方向直方图的字符特征表示第31-35页
    2.4 字符分类与支持向量机第35-39页
    2.5 字符识别实验第39-45页
        2.5.1 图像库及评测标准第39-40页
        2.5.2 二类字符分类的实验结果第40-44页
        2.5.3 62类字符分类的实验结果第44-45页
    2.6 本章小结第45-47页
第三章 基于分层特征过滤的文本定位方法第47-75页
    3.1 文本定位框架第47-48页
    3.2 字符定位第48-58页
        3.2.1 最大稳定极值区域第49-52页
        3.2.2 字符图像的分层特征第52-58页
    3.3 字符串定位第58-62页
        3.3.1 字符的融合第58-60页
        3.3.2 字符串的过滤第60-62页
    3.4 单词分割第62-63页
    3.5 文本定位实验第63-73页
        3.5.1 图像库及评测标准第63-66页
        3.5.2 ICDAR 2003的实验结果与分析第66-70页
        3.5.3 ICDAR 2011的实验结果与分析第70-71页
        3.5.4 SVT的实验结果与分析第71-73页
    3.6 本章小结第73-75页
第四章 端对端的自然场景文字识别方法第75-87页
    4.1 端对端的场景文字识别的模型框架第76-80页
        4.1.1 基于词典的文本识别第76-77页
        4.1.2 基于编辑距离的文本矫正第77-80页
    4.2 场景文字识别实验第80-86页
        4.2.1 图像库及评测标准第80-81页
        4.2.2 ICDAR 2003的实验结果与分析第81-83页
        4.2.3 词典容量对识别性能的影响第83-84页
        4.2.4 SVT的实验结果与分析第84-86页
    4.3 本章小结第86-87页
第五章 总结与展望第87-89页
    5.1 总结第87页
    5.2 展望第87-89页
参考文献第89-95页
研究生期间的科研成果第95-97页
致谢第97页

论文共97页,点击 下载论文
上一篇:电视益智节目的叙事学研究
下一篇:基于多字典和稀疏表示的图像去噪方法