首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于深度学习的自然场景文字识别

摘要第4-5页
Abstract第5-6页
第1章 绪论第12-20页
    1.1 引言第12-13页
    1.2 相关技术及研究现状第13-18页
        1.2.1 自然场景文字处理流程第13-14页
        1.2.2 自然场景文字识别的困难和挑战第14-15页
        1.2.3 自然场景文字识别的研究现状第15-17页
        1.2.4 现有方法存在的问题第17-18页
    1.3 本文研究目标与内容第18-20页
第2章 基于深度学习的文字识别框架第20-30页
    2.1 深度学习理论第20-25页
        2.1.1 人工神经网络第20-24页
        2.1.2 神经网络训练第24-25页
    2.2 基于深度学习的自然场景文字识别框架第25-29页
        2.2.1 问题分析第25-26页
        2.2.2 框架介绍第26-29页
    2.3 本章小结第29-30页
第3章 基于CNN和BiRNN的图像编码第30-43页
    3.1 方法概述第30-31页
    3.2 图像预处理第31-32页
    3.3 基于CNN的静态局部特征提取第32-38页
        3.3.1 CNN网络结构概述第32-34页
        3.3.2 CNN网络设计第34-38页
    3.4 基于BiRNN的上下文特征提取第38-42页
        3.4.1 BiRNN网络结构概述第38-39页
        3.4.2 BiRNN网络设计第39-42页
    3.5 注解向量序列生成第42页
    3.6 本章总结第42-43页
第4章 基于ARSG的文字解码第43-52页
    4.1 方法概述第43-44页
    4.2 基于注意力机制的字符定位第44-47页
        4.2.1 注意力机制简介第44-46页
        4.2.2 效率优化第46-47页
    4.3 基于ARSG的字符序列生成第47-51页
        4.3.1 算法概述第47-48页
        4.3.2 网络结构第48-49页
        4.3.3 延迟生成第49-50页
        4.3.4 Beam搜索第50-51页
    4.4 本章小结第51-52页
第5章 神经网络训练策略第52-59页
    5.1 引言第52页
    5.2 训练加速策略第52-55页
        5.2.1 CNN预训练第52-53页
        5.2.2 基于GPU的训练加速方法第53-54页
        5.2.3 Downpour SGD训练算法第54-55页
    5.3 过拟合预防策略第55-57页
        5.3.1 数据增广第55-56页
        5.3.2 Dropout第56页
        5.3.3 早期停止第56-57页
        5.3.4 权值衰减第57页
    5.4 本章小结第57-59页
第6章 实验与分析第59-67页
    6.1 引言第59页
    6.2 数据集第59-60页
    6.3 实验过程第60-62页
        6.3.1 实验环境第60页
        6.3.2 实验配置第60-61页
        6.3.3 实验结果第61-62页
    6.4 结果分析第62-66页
        6.4.1 识别过程可视化第62-63页
        6.4.2 泛化能力分析第63-65页
        6.4.3 性能分析第65页
        6.4.4 参数数量分析第65页
        6.4.5 延迟生成对结果的影响第65-66页
    6.5 本章小结第66-67页
第7章 总结与展望第67-69页
    7.1 总结第67页
    7.2 展望第67-69页
参考文献第69-73页
攻读硕士学位期间主要的研究成果第73-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:基于中间模型的仿真数据挖掘关键技术研究及应用
下一篇:黄精多糖抗缺氧诱导的原代新生大鼠大脑皮层神经细胞凋亡研究