首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于深度学习的自然场景文本检测与识别算法研究

摘要第5-6页
ABSTRACT第6-7页
符号对照表第10-11页
缩略语对照表第11-14页
第一章 绪论第14-20页
    1.1 研究背景与意义第14页
    1.2 研究现状第14-18页
        1.2.1 自然场景文本检测的研究现状第15-17页
        1.2.2 自然场景文本识别的研究现状第17-18页
    1.3 论文内容及章节安排第18-20页
第二章 基于多通道多尺度与由粗到细级联过滤的自然场景文本检测第20-42页
    2.1 引言第20页
    2.2 基于多通道多尺度的字符候选区域提取第20-23页
        2.2.1 MSER的简单介绍第20-21页
        2.2.2 基于低 ΔMSER的字符候选区域提取第21-22页
        2.2.3 基于多通道MSER的字符候选区域提取第22页
        2.2.4 基于多尺度MSER的字符候选区域提取第22-23页
    2.3 基于形态学的粗过滤第23-25页
        2.3.1 基于简单形态学特征的粗过滤第23-24页
        2.3.2 基于笔画宽度及其变异系数的粗过滤第24-25页
        2.3.3 重复字符候选区域去除第25页
    2.4 基于CNN的细过滤第25-30页
        2.4.1 卷积神经网络的简单介绍第26-28页
        2.4.2 二分类卷积神经网络模型第28-29页
        2.4.3 训练数据集的合成第29页
        2.4.4 模型训练与框架第29-30页
        2.4.5 字符候选区域细过滤第30页
    2.5 字符串合成及过滤第30-32页
        2.5.1 水平方向字符串合成及过滤第30-31页
        2.5.2 多方向字符串合成及过滤第31-32页
    2.6 实验结果与分析第32-39页
        2.6.1 数据库介绍第32-33页
        2.6.2 定位结果评价标准第33-34页
        2.6.3 实验结果与分析第34-39页
    2.7 本章小结第39-42页
第三章 基于上下文内容的隐分割自然场景文本识别第42-54页
    3.1 引言第42页
    3.2 循环神经网络简介第42-43页
    3.3 文本识别模型第43-48页
        3.3.1 输入图像预处理第44页
        3.3.2 基于CNN的序列特征提取第44-45页
        3.3.3 基于双向LSTM对上下文信息的处理第45-46页
        3.3.4 基于CTC的转录第46-47页
        3.3.5 模型训练与框架第47-48页
    3.4 文本识别第48页
        3.4.1 普通剪切图片文本识别第48页
        3.4.2 基于倾斜矫正的端对端自然场景文本检测与识别第48页
    3.5 实验结果与分析第48-53页
        3.5.1 数据库介绍第48-49页
        3.5.2 文本识别结果评价标准第49页
        3.5.3 实验结果与分析第49-53页
    3.6 本章小结第53-54页
第四章 总结与展望第54-56页
    4.1 总结第54-55页
    4.2 展望第55-56页
参考文献第56-60页
致谢第60-62页
作者简介第62-63页

论文共63页,点击 下载论文
上一篇:基于卷积神经网络的深度图像超分辨重构
下一篇:基于Android的低功耗蓝牙智能家居软件系统设计与实现