首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于Tesseract开源OCR引擎的证件识别系统的设计与实现

摘要第3-5页
Abstract第5页
第1章 绪论第9-12页
    1.1 研究背景及意义第9页
    1.2 国内外研究现状及发展方向第9-10页
    1.3 本文工作内容总结第10-11页
    1.4 本章小结第11-12页
第2章 关键技术第12-16页
    2.1 JAVA第12页
    2.2 TesseractOCR第12-14页
    2.3 OpenCV第14页
    2.4 本章小结第14-16页
第3章 图像的预处理第16-22页
    3.1 预处理的目的第16页
    3.2 图像灰度化、二值化的方法第16-17页
        3.2.1 灰度化第16页
        3.2.2 二值化第16-17页
    3.3 去噪的方法第17-18页
        3.3.1 中值滤波第18页
        3.3.2 均值滤波第18页
    3.4 倾斜校正第18-20页
        3.4.1 投影校正第19页
        3.4.2 近邻法第19页
        3.4.3 Hough 变换第19-20页
    3.5 图像增强第20-21页
        3.5.1 常规增强第20-21页
        3.5.2 加权增强第21页
    3.6 本章小结第21-22页
第4章 核心图像的提取与还原第22-38页
    4.1 核心图像提取的目的第22页
    4.2 边缘检测第22-28页
        4.2.1 Canny 边缘检测算法:第22-23页
        4.2.2 算法的实现第23-27页
        4.2.3 实际的处理效果第27-28页
    4.3 直线检测第28-30页
        4.3.1 霍夫变换的算法第28-29页
        4.3.2 霍夫变换代码实现第29-30页
        4.3.3 霍夫变换测试结果第30页
    4.4 透视变换第30-37页
        4.4.1 透视变换的算法第30-33页
        4.4.2 透视变换的实现代码第33-36页
        4.4.3 透视变换测试效果第36-37页
    4.5 本章小结第37-38页
第5章 训练 TesseractOCR第38-47页
    5.1 Tesseract 概述第38页
    5.2 训练 Tesseract 训练集的目的第38-40页
        5.2.1 应对不同的字体第38-39页
        5.2.2 词语以及常用词语的组合第39-40页
    5.3 训练集的制作第40-44页
        5.3.1 字体属性第40页
        5.3.2 词组表第40-41页
        5.3.3 常用词组第41-42页
        5.3.4 训练图像及 box 文件第42-44页
    5.4 训练的流程第44-46页
        5.4.1 细节解释第44页
        5.4.2 制作 Box 文件第44-45页
        5.4.3 修正 Box 文件第45页
        5.4.4 聚类 Clustering第45页
        5.4.5 合并 Combine第45-46页
    5.5 训练的优化第46页
    5.6 本章小结第46-47页
第6章 Tesseract 识别的优化第47-56页
    6.1 利用 Tesseract 实现汉字 OCR 的目的第47页
    6.2 识别参数的研究第47-48页
    6.3 识别参数的优化第48-49页
    6.4 使用定制的训练集针优化训练过程第49-55页
        6.4.1 定制性别的识别训练集第49-50页
        6.4.2 定制民族的识别训练集第50-54页
        6.4.3 定制地址的识别训练集第54-55页
    6.5 本章小结第55-56页
总结与展望第56-57页
参考文献第57-60页
致谢第60页

论文共60页,点击 下载论文
上一篇:统一服务交互平台的设计与实现
下一篇:无线电监测管理系统的应用研究