首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于深度学习的场景文字检测与识别

摘要第5-6页
ABSTRACT第6页
第一章 绪论第10-21页
    1.1 选题背景及研究意义第10-11页
    1.2 国内外研究现状第11-18页
        1.2.1 文字检测方法第12-17页
        1.2.2 场景文字识别第17-18页
    1.3 本文完成的工作第18-19页
    1.4 本文的结构第19-21页
第二章 深度学习方法概述第21-28页
    2.1 卷积神经网络概述第22-23页
    2.2 卷积神经网络在视觉领域的应用第23-26页
    2.3 卷积神经网络的模型优化第26-28页
        2.3.1 优化算法第26页
        2.3.2 加速计算第26页
        2.3.3 模型压缩第26-27页
        2.3.4 提升仿射不变性第27页
        2.3.5 数据预处理第27-28页
第三章 基于全卷积神经网络的候选文本框生成和文字检测第28-46页
    3.1 引言第28-30页
    3.2 通用物体候选基本方法第30-33页
        3.2.1 Selective Search第30-31页
        3.2.2 BING第31页
        3.2.3 Edge Boxes第31-32页
        3.2.4 MCG第32页
        3.2.5 小结第32-33页
    3.3 基本检测方法第33-37页
        3.3.1 通用物体检测基本方法第33-37页
        3.3.2 场景文字检测基本方法第37页
    3.4 基于全卷积神经网络的候选文本框生成和文字检测方法第37-42页
        3.4.1 文字区域候选生成第37-39页
        3.4.2 文字检测第39-40页
        3.4.3 端到端的学习优化第40-41页
        3.4.4 启发式处理第41-42页
    3.5 实验结果及分析第42-45页
        3.5.1 实验数据第42-43页
        3.5.2 Inception-RPN评价第43页
        3.5.3 文字检测网络分析第43-44页
        3.5.4 整个文字检测框架的实验结果第44-45页
    3.6 本章小结第45-46页
第四章 自然场景文字识别第46-61页
    4.1 引言第46-47页
    4.2 深度网络模型结构生成工具第47-48页
    4.3 场景单词图片渲染第48-50页
    4.4 基于单词编码的识别方法第50-51页
    4.5 卷积递归神经网络第51-57页
        4.5.1 特征序列提取第52-53页
        4.5.2 序列标注第53-55页
        4.5.3 转录层第55-56页
        4.5.4 网络训练第56-57页
    4.6 实验结果及分析第57-59页
        4.6.1 实验数据第57页
        4.6.2 实现细节第57-58页
        4.6.3 实验分析第58-59页
    4.7 本章小结第59-61页
总结与展望第61-63页
    全文总结第61页
    后续工作展望第61-63页
参考文献第63-72页
攻读硕士学位期间取得的研究成果第72-73页
致谢第73-74页
附件第74页

论文共74页,点击 下载论文
上一篇:基于云平台的科研项目管理系统的设计和实现
下一篇:基于FPGA的图像传感器设计与边缘检测