首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

复杂场景文本识别技术研究

致谢第4-5页
摘要第5-7页
Abstract第7-8页
1 引言第15-22页
    1.1 课题研究的背景和意义第15-16页
        1.1.1 课题研究的背景第15-16页
        1.1.2 课题研究的意义第16页
    1.2 研究内容第16-19页
        1.2.1 少样本词文本识别第17页
        1.2.2 多通道词文本识别第17-18页
        1.2.3 场景端到端文本识别第18页
        1.2.4 论文研究内容之间的联系第18-19页
    1.3 主要贡献第19-20页
        1.3.1 基于二值标签编码网络的少样本词文本识别第19页
        1.3.2 基于深度卷积神经网络集成的多通道词文本识别第19-20页
        1.3.3 基于识别反馈机制的端到端文本识别第20页
    1.4 论文内容的组织结构第20-22页
2 复杂场景文本识别研究综述第22-47页
    2.1 复杂场景文本识别研究现状第22-30页
        2.1.1 复杂场景文本图像特点第23-26页
        2.1.2 词文本识别技术研究现状第26-28页
        2.1.3 端到端识别系统研究现状第28-30页
    2.2 文本图像特征表示第30-35页
        2.2.1 手写体文本图像特征表示第31-32页
        2.2.2 自然场景文本图像特征表示第32-33页
        2.2.3 基于深度学习的文本图像特征表示第33-35页
    2.3 识别结果标签编码第35页
    2.4 识别模型构建第35-41页
        2.4.1 基于字符图像建模的识别模型第35-38页
        2.4.2 基于局部区域建模的识别模型第38-39页
        2.4.3 基于整词图像建模的识别模型第39-41页
    2.5 文本区域定位第41-46页
        2.5.1 基于纹理的文本区域定位第41-43页
        2.5.2 基于连通域的文本区域定位第43-45页
        2.5.3 基于层次结构的文本区域定位第45-46页
    2.6 识别的后处理第46页
    2.7 本章小结第46-47页
3 基于二值标签编码网络的少样本词文本识别第47-66页
    3.1 算法概述第47-56页
        3.1.1 整体框架第47-48页
        3.1.2 基于深度卷积神经网络的特征提取第48-51页
        3.1.3 基于迭代量化方法的二值标签编码第51-54页
        3.1.4 基于核典型相关分析的相关匹配第54-56页
    3.2 实验验证第56-65页
        3.2.1 数据集和评价标准第56-57页
        3.2.2 手写体文本识别实验第57-58页
        3.2.3 不同特征提取方法对识别性能的影响第58-60页
        3.2.4 不同二值标签编码对识别结果的影响第60-64页
        3.2.5 不同相关匹配方法对识别性能的影响第64-65页
    3.3 本章小结第65-66页
4 基于深度卷积神经网络集成的多通道词文本识别第66-89页
    4.1 算法概述第67-79页
        4.1.1 整体框架和模型集成第67-68页
        4.1.2 基于通道扩展的深度卷积神经网络文本识别第68-71页
        4.1.3 基于深度卷积神经网络文本识别第71-75页
        4.1.4 深度卷积神经网络集成第75-77页
        4.1.5 深度卷积神经网络文本识别结果扩展第77-79页
    4.2 实验验证第79-88页
        4.2.1 数据集和评价标准第79-80页
        4.2.2 自然场景文本识别实验第80-82页
        4.2.3 不同通道组合对识别性能的影响第82-84页
        4.2.4 不同识别模型对识别性能的影响第84-86页
        4.2.5 识别扩展对识别性能的影响第86-88页
    4.3 本章小结第88-89页
5 基于识别反馈机制的端到端文本识别第89-111页
    5.1 算法概述第90-100页
        5.1.1 基于检测-识别反馈机制的通用框架第90-94页
        5.1.2 基于局部编辑距离匹配的内容校正算法第94-97页
        5.1.3 基于识别反馈机制的端到端文本识别模型第97-98页
        5.1.4 词文本区域粗定位第98页
        5.1.5 基于拟合模型的词文本区域精定位第98-100页
        5.1.6 基于字符序列建模的非最大值抑制算法第100页
    5.2 实验验证第100-110页
        5.2.1 数据集和评测标准第101-102页
        5.2.2 自然场景端到端文本识别实验第102-107页
        5.2.3 不同粗定位模型对识别性能的影响第107-108页
        5.2.4 不同内容校正模型对识别性能的影响第108-109页
        5.2.5 不同词典大小对识别性能的影响第109-110页
    5.3 本章小结第110-111页
6 结论第111-113页
参考文献第113-123页
作者简历及在学研究成果第123-126页
学位论文数据集第126页

论文共126页,点击 下载论文
上一篇:BIM技术在巴基斯坦典型建筑中的应用与研究
下一篇:深圳市外来务工人员的管理模式研究