首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于深度学习的场景文本检测的研究

摘要第4-5页
Abstract第5页
第1章 绪论第9-15页
    1.1 研究背景与意义第9-10页
    1.2 国内外研究现状第10-13页
        1.2.1 传统方法第11页
        1.2.2 基于深度学习的方法第11-13页
    1.3 主要工作和贡献第13-14页
    1.4 论文结构安排第14-15页
第2章 目标检测技术基础第15-25页
    2.1 R-CNN系列方法第15-21页
        2.1.1 候选目标区域提取第15-16页
        2.1.2 R-CNN第16页
        2.1.3 FastR-CNN第16-19页
        2.1.4 FasterR-CNN第19-21页
    2.2 SSD第21-23页
    2.3 反思第23页
    2.4 本章小结第23-25页
第3章 基于特征金字塔的场景文本检测第25-45页
    3.1 网络结构第25-29页
        3.1.1 主干网络第25-27页
        3.1.2 特征金字塔第27-28页
        3.1.3 检测模块第28-29页
    3.2 技术细节第29-39页
        3.2.1 atrous卷积第29-30页
        3.2.2 特征金字塔第30-34页
        3.2.3 先验盒第34-36页
        3.2.4 预测层第36-37页
        3.2.5 匹配规则第37-38页
        3.2.6 损失函数第38-39页
    3.3 实验第39-44页
        3.3.1 实验环境第39页
        3.3.2 数据集第39页
        3.3.3 训练和测试第39-40页
        3.3.4 验证特征金字塔的有效性第40页
        3.3.5 检测小文本的实验第40-42页
        3.3.6 不同配置下的FPTD性能对比第42页
        3.3.7 与其他检测方法的对比第42-43页
        3.3.8 检测效果展示与分析第43-44页
    3.4 本章小结第44-45页
第4章 基于弱监督的场景文本注意力网络第45-63页
    4.1 网络模型第45-46页
    4.2 技术细节第46-53页
        4.2.1 空间金字塔池化第46-48页
        4.2.2 类激活图的生成第48-50页
        4.2.3 感受野和多尺度问题第50-51页
        4.2.4 生成文本候选区域第51-53页
    4.3 实验第53-60页
        4.3.1 实验环境第53页
        4.3.2 数据集第53页
        4.3.3 训练第53-54页
        4.3.4 测试第54页
        4.3.5 二分类效果第54页
        4.3.6 文本候选区域提取效果第54-55页
        4.3.7 ICDAR2013数据集上的召回效果第55-56页
        4.3.8 ICDAR2015数据集上的召回效果第56-59页
        4.3.9 单一尺度输入的召回效果第59页
        4.3.10 与其他文本proposal方法的比较第59-60页
    4.4 本章小结第60-63页
结论第63-67页
    本文总结第63-64页
    工作展望第64-67页
参考文献第67-73页
附录一 ICDAR2013数据集介绍第73-78页
附录二 ICDAR2015数据集介绍第78-80页
附录三 FPTD评测结果截图第80-83页
攻读硕士学位期间取得的成果第83-85页
致谢第85页

论文共85页,点击 下载论文
上一篇:并行卷积神经网络和灾难性遗忘问题的研究
下一篇:基于机器视觉的机器人系统的开发