首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于深度学习的端到端自然场景文字提取

摘要第10-12页
ABSTRACT第12-13页
第一章 绪论第16-28页
    1.1 研究背景第16-19页
    1.2 研究难点与思路第19-21页
    1.3 文献综述第21-25页
        1.3.1 自然场景文字检测第21-24页
        1.3.2 场景文字识别第24-25页
    1.4 研究贡献第25-26页
    1.5 论文结构第26-28页
第二章 理论框架第28-46页
    2.1 监督学习第28-29页
    2.2 随机梯度下降第29-31页
    2.3 深度神经网络第31-37页
        2.3.1 激活函数第32-33页
        2.3.2 输出层和损失函数第33-34页
        2.3.3 神经网络的前向传播第34页
        2.3.4 神经网络的反向传播第34-36页
        2.3.5 梯度检查第36-37页
    2.4 卷积神经网络第37-39页
    2.5 递归神经网络第39-44页
        2.5.1 RNN的前向传播第41页
        2.5.2 RNN的反向传播第41-43页
        2.5.3 递归神经网络的梯度不稳定性第43-44页
    2.6 批量归一化第44-45页
    2.7 本章小结第45-46页
第三章 VRPN端到端自然场景文字检测模型第46-68页
    3.1 算法设计思想第46-48页
    3.2 VRPN文字检测模型第48-54页
        3.2.1 区域候选网络第48-49页
        3.2.2 纵向回归候选网络第49-50页
        3.2.3 多任务学习第50-53页
        3.2.4 文字检测第53-54页
    3.3 实验与分析第54-64页
        3.3.1 自然场景文字检测数据集第54-57页
        3.3.2 算法评估第57-59页
        3.3.3 模型实验第59-64页
        3.3.4 在不同语言文字上的检测效果第64页
    3.4 本章小结第64-68页
第四章 混合CNN/HMM自然场景文字识别模型第68-94页
    4.1 问题描述与建模第68-69页
    4.2 文字图像的HMM序列建模第69-71页
    4.3 混合CNN-HMM模型第71-77页
        4.3.1 基于CNN的字符序列建模第71-72页
        4.3.2 CNN-HMM模型结构第72-74页
        4.3.3 特征提取第74-75页
        4.3.4 训练步骤第75-77页
    4.4 前向后向算法第77-80页
        4.4.1 通用前向后向算法第77-79页
        4.4.2 HMM的前向后向算法第79-80页
    4.5 基于Baum-Welch算法的HMM训练第80-81页
    4.6 基于Viterbi算法的文字识别第81-83页
    4.7 实验及结果第83-91页
        4.7.1 数据集及预处理第83-84页
        4.7.2 特征提取第84页
        4.7.3 模型训练第84-86页
        4.7.4 结果评估第86-88页
        4.7.5 混合CNN-HMM模型的性能提升第88-89页
        4.7.6 CNN网络的层切除实验第89-90页
        4.7.7 计算复杂度第90-91页
    4.8 本章小结第91-94页
第五章 CNN-LSTM-CTC端到端文字识别模型第94-110页
    5.1 序列信息的门限控制第95-97页
    5.2 双向递归神经网络第97-98页
    5.3 基于CTC算法的变长序列映射第98-100页
    5.4 CTC前向后向算法第100-102页
    5.5 CTC层的反向传播第102-103页
    5.6 文字识别第103页
    5.7 实验与分析第103-108页
        5.7.1 数据集与评估方法第103-104页
        5.7.2 网络结构第104-106页
        5.7.3 结果及分析第106-108页
    5.8 本章小结第108-110页
第六章 总结与展望第110-112页
    6.1 全文总结第110-111页
    6.2 后续工作展望第111-112页
致谢第112-114页
参考文献第114-130页
作者在学期间取得的学术成果第130-131页

论文共131页,点击 下载论文
上一篇:基于暗通道先验的图像和视频去雾模型及算法研究
下一篇:面向异构计算的大数据处理与资源调度关键问题研究