首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于智能手机的中文文档数字化研究与实现

摘要第5-6页
abstract第6页
第一章 绪论第11-15页
    1.1 本课题研究的背景第11-12页
        1.1.1 智能手机的快速发展和普及第11页
        1.1.2 智能手机拍摄和处理能力的进步第11-12页
        1.1.3 文字识别技术的发展第12页
        1.1.4 利用智能手机对文档进行数字化第12页
    1.2 研究目标及国内外研究现况第12-13页
        1.2.1 研究目标第12页
        1.2.2 国内外研究现况第12-13页
    1.3 研究内容和意义第13页
        1.3.1 研究内容第13页
        1.3.2 研究意义第13页
    1.4 本文的章节安排第13-15页
第二章 相关概念与技术介绍第15-22页
    2.1 图像采集第15-16页
        2.1.1 采集原理第15页
        2.1.2 颜色空间第15-16页
        2.1.3 图像数据结构第16页
    2.2 图像增强第16-17页
    2.3 图像分割第17-19页
    2.4 二值图像处理第19-20页
        2.4.1 连通域分析第19页
        2.4.2 二值图像数学形态学第19-20页
    2.5 特征提取第20-21页
    2.6 训练与识别第21-22页
第三章 Tesseract-OCR研 究与分析第22-32页
    3.1 Tesseract-OCR发 展历史第22页
    3.2 识别流程第22-27页
        3.2.1 流程图第22页
        3.2.2 自适应阈值计算第22-24页
        3.2.3 版面分析第24-25页
        3.2.4 连通域分析第25页
        3.2.5 行查找第25-26页
        3.2.6 单词查找第26页
        3.2.7 单词识别第26-27页
    3.3 分类与训练第27-30页
        3.3.1 特征空间第27-28页
        3.3.2 静态分类器第28-29页
        3.3.3 样本训练第29页
        3.3.4 自适应分类器第29-30页
    3.4 多语言支持第30-32页
第四章 Tesseract-OCR改 进与优化第32-40页
    4.1 图像处理增强第32-38页
        4.1.1 自适应双阈值法图像二值化第32-37页
        4.1.2 倾斜弯曲校正第37-38页
    4.2 简体中文识别速度优化第38页
        4.2.1 去除Pass2和自适应分类器训练第38页
        4.2.2 字宽模式第38页
    4.3 简体中文识别准确率优化第38-40页
        4.3.1 字符内部轮廓数第38页
        4.3.2 汉字字宽第38-39页
        4.3.3 N - gram模 型第39-40页
第五章 文档数字化系统原型设计与实现第40-55页
    5.1 基本需求分析第40页
        5.1.1 应用场景介绍第40页
        5.1.2 运行环境第40页
    5.2 系统框架第40-43页
        5.2.1 系统框图第40-41页
        5.2.2 图像采集模块第41页
        5.2.3 图像处理模块第41-42页
        5.2.4 文字识别模块第42页
        5.2.5 后处理模块第42-43页
        5.2.6 PDF生 成模块第43页
    5.3 开发调试环境搭建第43-52页
        5.3.1 安装JDK第43-44页
        5.3.2 安装Android Studio第44-45页
        5.3.3 安装NDK第45-48页
        5.3.4 编译Tesseract - OCR库第48-50页
        5.3.5 调试环境搭建第50-52页
    5.4 用户界面第52-55页
        5.4.1 主界面第52-53页
        5.4.2 图片来源选取界面第53-54页
        5.4.3 图片裁剪界面第54页
        5.4.4 拍摄界面第54-55页
第六章 测试与分析第55-62页
    6.1 测试环境第55-56页
        6.1.1 算法测试环境第55页
        6.1.2 系统测试环境第55-56页
        6.1.3 对比工具第56页
        6.1.4 训练文件第56页
    6.2 算法优化对识别性能的提升第56-58页
        6.2.1 去除Pass2 和自适应分类器训练对性能的影响第56-57页
        6.2.2 采取固定字宽模式对性能的影响第57-58页
    6.3 算法优化对识别准确率的提升第58-59页
    6.4 图像预处理的影响第59-61页
        6.4.1 图像缩放的影响第59-60页
        6.4.2 自适应双阈值法图像二值化的影响第60-61页
    6.5 总结与分析第61-62页
第七章 结束语第62-64页
    7.1 论文工作总结第62页
    7.2 后续工作展望第62-64页
参考文献第64-67页
致谢第67-68页
附件第68页

论文共68页,点击 下载论文
上一篇:集团人力资源管理系统的设计与实现
下一篇:MOOC与SPOC论坛交互分析对比研究--以《现代教育技术》课程为例