首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于深度学习的场景图像文本检测技术

摘要第4-6页
ABSTRACT第6-8页
1 绪论第11-17页
    1.1 研究背景及意义第11-12页
    1.2 国内外研究现状第12-14页
        1.2.1 文本区域定位方法第12-14页
        1.2.2 文字识别方法第14页
    1.3 论文研究内容第14-15页
    1.4 论文结构安排第15-17页
2 相关工作第17-29页
    2.1 自然场景文本数据集第17-20页
        2.1.1 ICDAR2013数据集第17-18页
        2.1.2 COCO-Text数据集第18-19页
        2.1.3 RCTW-17数据集第19页
        2.1.4 MSRA-TD500数据集第19-20页
    2.2 特征提取方法第20-23页
        2.2.1 MSER特征第20-21页
        2.2.2 SWT特征第21-23页
        2.2.3 深度学习特征第23页
    2.3 基于深度学习的目标检测框架第23-27页
        2.3.1 R-CNN系列第23-26页
        2.3.2 SSD第26-27页
    2.4 评估方法第27-28页
    2.5 本章小结第28-29页
3 人工生成文档图像数据集第29-33页
    3.1 人工合成带有文本的图像第29-31页
        3.1.1 自然场景文本数据集第30-31页
        3.1.2 文字识别数据集第31页
    3.2 人工生成数据集标注及校准第31-32页
    3.3 本章小结第32-33页
4 基于深度学习的场景文本检测算法设计第33-49页
    4.1 自然场景文本检测器第33-38页
        4.1.1 基础网络(BaseNetwork)第33-34页
        4.1.2 卷积检测预测器第34-35页
        4.1.3 Anchor-box(默认框)设计第35-36页
        4.1.4 多尺度特征图检测第36-37页
        4.1.5 批归一化处理(BatchNormalization)第37页
        4.1.6 非极大值抑制(NMS)第37-38页
    4.2 使用FCN生成位置概要图第38-39页
    4.3 对检测器与位置概要图的融合使用第39-41页
    4.4 模型训练第41页
    4.5 实验结果对比及分析第41-47页
        4.5.1 ICDAR2013数据集实验结果第42-43页
        4.5.2 MSRA-TD500数据集实验结果第43-44页
        4.5.3 COCO-Text数据集实验结果第44-45页
        4.5.4 RCTW-17数据集实验结果第45-46页
        4.5.5 位置概要网络实验结果分析第46-47页
    4.6 本章小结第47-49页
5 基于深度学习的文本序列识别第49-55页
    5.1 文本序列识别算法第49-51页
        5.1.1 识别算法网络结构第49-51页
        5.1.2 CTC(ConnectionistTemporalClassification)损失函数第51页
    5.2 文本序列数据集第51页
    5.3 对文本序列图像识别算法性能的研究第51-52页
    5.4 本章小结第52-55页
6 总结与展望第55-57页
    6.1 总结第55-56页
    6.2 展望第56-57页
参考文献第57-61页
致谢第61-62页

论文共62页,点击 下载论文
上一篇:基于忆阻器电子突触的神经网络及应用
下一篇:视觉引导下的移动机器人自主充电技术研究