首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于深度学习算法的视频文本区域定位与识别

摘要第5-6页
Abstract第6-7页
第1章 绪论第10-16页
    1.1 研究背景及意义第10-11页
    1.2 国内外研究现状第11-15页
        1.2.1 文字识别发展历程第11-12页
        1.2.2 文本定位研究现状第12-13页
        1.2.3 已有方法的不足第13-15页
    1.3 本文主要研究内容第15-16页
第2章 Gabor滤波器的分析与设计第16-26页
    2.1 Gabor滤波器分析第16-21页
        2.1.1 正弦平面波的特性第16-20页
        2.1.2 Gaussian核函数的特性第20-21页
    2.2 Gabor滤波器设计第21-23页
    2.3 Gabor滤波器特征表征第23-25页
    2.4 本章小结第25-26页
第3章 DBN网络构建与视频文本定位第26-46页
    3.1 深度学习概述第26页
    3.2 RBM原理及分析第26-31页
        3.2.1 RBM网络结构第26-27页
        3.2.2 RBM模型分析第27-29页
        3.2.3 RBM模型的构建第29-31页
    3.3 DBN网络原理与分析第31-35页
        3.3.1 DBN网络基本原理第31-32页
        3.3.2 DBN网络模型分析第32页
        3.3.3 DBN网络的训练第32-35页
    3.4 视频文本区域判别第35-36页
    3.5 文本跟踪第36-38页
    3.6 文本区域定位结果及分析第38-44页
        3.6.1 不同网络结构处理能力的比较第38-39页
        3.6.2 与传统文本定位方法的比较第39-40页
        3.6.3 视频图像文本区域定位处理结果第40-44页
    3.7 本章小结第44-46页
第4章 形态学图像去噪处理第46-54页
    4.1 形态学处理原理第46页
    4.2 二值腐蚀与膨胀第46-49页
        4.2.1 对定位区域进行腐蚀第46-48页
        4.2.2 对定位区域进行膨胀第48-49页
    4.3 对定位区域的二值开和闭第49-52页
        4.3.1 对定位区域的二值开处理第49-50页
        4.3.2 对定位区域的二值闭处理第50-52页
        4.3.3 二值开闭混合运算的对比第52页
    4.4 形态学其他处理方法第52-53页
    4.5 本章小结第53-54页
第5章 文本增强与OCR识别第54-62页
    5.1 文本增强第54-55页
    5.2 字符识别的基本流程第55页
    5.3 文本图像二值化第55-57页
        5.3.1 文本区域二值化第56页
        5.3.2 二值图像反转第56-57页
    5.4 文字切分与归一化第57-58页
        5.4.1 文字切分第57页
        5.4.2 归一化第57-58页
    5.5 特征提取与OCR识别第58-61页
        5.5.1 特征提取第58-59页
        5.5.2 OCR识别第59-61页
    5.6 本章小结第61-62页
结论第62-63页
参考文献第63-67页
攻读硕士学位期间所发表的学术论文第67-68页
致谢第68页

论文共68页,点击 下载论文
上一篇:基于小波信息熵的脑干听觉诱发电位检测系统设计
下一篇:基于平衡线圈法的铁矿含铁量在线检测系统设计