首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于递归卷积网络的手写及场景文本识别的研究

摘要第5-6页
Abstract第6页
第一章 绪论第10-15页
    1.1 研究背景第10-11页
    1.2 研究目的和意义第11-12页
    1.3 本文完成的工作第12-14页
    1.4 本文结构第14-15页
第二章 序列文本识别技术分析第15-26页
    2.1 脱机手写文本识别第15-21页
        2.1.1 卷积网络特征提取器第16-17页
        2.1.2 无须切分序列识别第17-21页
    2.2 自然场景文本识别第21-25页
        2.2.1 切分识别模型第21-22页
        2.2.2 基于全图大规模分类模型第22页
        2.2.3 递归卷积网络模型第22-24页
        2.2.4 自适应纠正的识别模型第24-25页
    2.3 本章小结第25-26页
第三章 面向手写文本多方向递归卷积网络第26-46页
    3.1 基础框架确定及问题分析第26-28页
        3.1.1 基础框架描述第26-28页
        3.1.2 基础框架存在的问题第28页
    3.2 多方向递归神经网络第28-34页
        3.2.1 SpatialRNN介绍第29-31页
        3.2.2 多方向递归网络基本组成第31-32页
        3.2.3 多方向递归网络的上下文信息学习第32-34页
    3.3 捷径连接与多层次特征融合第34-37页
        3.3.1 深度残差网络介绍第34-36页
        3.3.2 捷径连接与多层级特征融合第36-37页
    3.4 整体框架描述第37-38页
    3.5 实验结果与分析第38-44页
        3.5.1 实验数据集描述第39-40页
        3.5.2 整体网络设置与数据处理第40-41页
        3.5.3 系列对比实验和分析第41-44页
    3.6 本章小结第44-46页
第四章 面向自然场景文本的注意力模型及局部区域学习第46-68页
    4.1 注意力机制介绍及其适用性分析第46-52页
        4.1.1 注意力机制原理介绍第47页
        4.1.2 编码-解码结构框架第47-49页
        4.1.3 注意力机制在机器翻译中的应用第49-51页
        4.1.4 注意力机制在自然场景文本识别中的适用性第51-52页
    4.2 基础注意力模型局限性分析第52-55页
        4.2.1 注意力概率分布分析第52-54页
        4.2.2 可视化结果及分析第54-55页
    4.3 多行注意力模型第55-57页
        4.3.1 多行注意力模型框架及加权映射坐标第55-56页
        4.3.2 多行注意力模型可视化分析第56-57页
    4.4 基于字符标注的区域学习算法第57-62页
        4.4.1 基于字符标注的合成数据第57-58页
        4.4.2 字符中心回归约束第58-59页
        4.4.3 字符区域定位与宽高回归第59-61页
        4.4.4 区域学习算法第61-62页
    4.5 实验结果与分析第62-66页
        4.5.1 实验数据集介绍第62-63页
        4.5.2 模型整体框架介绍第63-64页
        4.5.3 实验结果与分析第64-66页
    4.6 本章小结第66-68页
总结展望第68-71页
参考文献第71-76页
攻读硕士学位期间取得的研究成果第76-77页
致谢第77-78页
附件第78页

论文共78页,点击 下载论文
上一篇:智能电网供电协作中继网络中继选择策略研究
下一篇:基于双神经网络的钢琴琴键音质评价方法研究