首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于神经网络的场景文字序列识别研究与应用

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-18页
    1.1 研究背景及意义第10-12页
    1.2 国内外研究现状第12-16页
        1.2.1 场景文字序列识别的困难第12-14页
        1.2.2 国内外研究现状第14-15页
        1.2.3 深度学习研究现状第15-16页
    1.3 主要工作和结构安排第16-18页
第二章 场景文字序列识别技术基础第18-36页
    2.1 三种主流场景文本序列识别技术第18-24页
        2.1.1 基于传统方法的场景文本序列识别第18-20页
        2.1.2 基于CTC的场景文本序列识别第20-22页
        2.1.3 基于注意力的场景文字序列识别第22-24页
    2.2 神经网络的相关理论第24-34页
        2.2.1 卷积神经网络(CNN,Convolutional Neural Network)第24-27页
        2.2.2 循环神经网络(RNN,Recurrent Neural Network)第27-30页
        2.2.3 连续时序分类算法(Connectionist Temporal Classification)第30-34页
    2.3 本章小结第34-36页
第三章 基于堆叠卷积神经网络的识别方法第36-50页
    3.1 网络模型的设计第37-44页
        3.1.1 模型的整体结构第37-38页
        3.1.2 基于ResNet的场景文字图片特征提取网络第38-41页
        3.1.3 基础模块第41-42页
        3.1.4 多步注意力机制第42-43页
        3.1.5 归一化和初始化策略第43-44页
    3.2 实验结果与分析第44-49页
        3.2.1 数据集第44页
        3.2.2 实验的细节第44-45页
        3.2.3 基于堆叠卷积的文字序列识别模型与其它识别模型的比较第45-46页
        3.2.4 不同类型卷积层对于识别模型识别率的影响第46-47页
        3.2.5 不同编解码层数对于识别准确率的影响第47页
        3.2.6 多步注意力机制的可视化第47-48页
        3.2.7 部分识别结果展示第48-49页
    3.3 本章小结第49-50页
第四章 先验注意力优化与并行化测试第50-60页
    4.1 先验注意力第50-52页
        4.1.1 场景文字序列识别中注意力的分布第50-51页
        4.1.2 两种先验注意力第51-52页
    4.2 并行化测试第52-55页
        4.2.1 开始符SOS的启发第53页
        4.2.2 位置嵌入(Position Embedding)第53页
        4.2.3 一种可并行化测试的场景文字序列识别框架第53-55页
    4.3 实验结果与分析第55-58页
        4.3.1 不同注意力机制识别效果的对比第55-56页
        4.3.2 不同注意力机制在小数据集上的表现效果第56-57页
        4.3.3 不同注意力机制收敛的比较第57页
        4.3.4 并行化测试框架中关键参数实验分析第57-58页
        4.3.5 不同框架在测试速度的比较第58页
    4.4 本章小结第58-60页
第五章 总结与展望第60-62页
    5.1 总结第60-61页
    5.2 展望第61-62页
参考文献第62-68页
致谢第68-70页
攻读学位期间取得的研究成果第70页

论文共70页,点击 下载论文
上一篇:从女权主义视角看美国黑人身份:评托尼·莫里森的新作《乐园》
下一篇:基于XML的网络服务中间件BizConnector的研究与实现