印刷体中文文档识别系统的研究
摘要 | 第1-6页 |
ABSTRACT | 第6-11页 |
第1章 绪论 | 第11-21页 |
·课题研究的目的和意义 | 第11-12页 |
·印刷体中文文档识别技术的概述 | 第12页 |
·印刷体汉字识别系统 | 第12-14页 |
·汉字识别的分类 | 第13页 |
·印刷体汉字识别的研究历程 | 第13-14页 |
·印刷体中文文档中的公式识别技术 | 第14-18页 |
·公式识别的分类 | 第14-15页 |
·公式识别的研究历程 | 第15-18页 |
·印刷体中文文档识别中存在的困难 | 第18-19页 |
·本文的研究内容 | 第19-21页 |
第2章 文档图像预处理 | 第21-31页 |
·图像二值化 | 第21-25页 |
·基于直方图谷点门限值的分割方法 | 第21页 |
·最大类间方差法 | 第21-22页 |
·最大熵法 | 第22-25页 |
·图像平滑去噪 | 第25-26页 |
·图像细化 | 第26-27页 |
·图像归一化 | 第27-30页 |
·位置归一化方法 | 第28页 |
·大小归一化方法 | 第28-30页 |
·本章小结 | 第30-31页 |
第3章 版面分析 | 第31-44页 |
·版面分析的概述 | 第31-32页 |
·版面分析的算法 | 第32-36页 |
·基于组合特征的中文版面分析算法 | 第32-34页 |
·基于神经网络的版面分析算法 | 第34-35页 |
·基于多层次可信度指导下的自底向上版面分析算法 | 第35-36页 |
·系统版面分析算法的研究 | 第36-43页 |
·连通域级别 | 第37页 |
·文本行列级别 | 第37-38页 |
·区域级别 | 第38-39页 |
·实验结果 | 第39-43页 |
·本章小结 | 第43-44页 |
第4章 印刷体汉字识别与表格识别 | 第44-59页 |
·印刷体汉字的特征提取 | 第44-47页 |
·汉字特征的分类 | 第44-45页 |
·常用的汉字特征 | 第45-47页 |
·印刷体汉字的分类器设计 | 第47-50页 |
·统计模式识别 | 第47-49页 |
·结构模式识别 | 第49页 |
·统计模式识别与结构模式识别的结合 | 第49页 |
·人工神经网络 | 第49-50页 |
·系统汉字识别的设计研究 | 第50-57页 |
·文本区域的处理 | 第50-52页 |
·多特征提取建立汉字模板库 | 第52页 |
·多分类器集成 | 第52-56页 |
·定位拒识字符 | 第56页 |
·实验结果 | 第56-57页 |
·系统表格识别的研究 | 第57-58页 |
·本章小结 | 第58-59页 |
第5章 公式字符的定位分割、识别与结构分析 | 第59-88页 |
·中文文档中公式字符的定位方法 | 第59-64页 |
·现有公式定位方法的介绍 | 第59-60页 |
·独立行公式的定位 | 第60-61页 |
·内嵌行公式的定位 | 第61-64页 |
·公式字符的分割方法 | 第64-66页 |
·公式字符的特点 | 第64-65页 |
·公式字符的分割方法 | 第65-66页 |
·公式字符的识别方法 | 第66-69页 |
·公式字符的特征提取与选择 | 第67-68页 |
·建立字符模板库 | 第68页 |
·公式字符识别方法 | 第68-69页 |
·公式字符的结构分析方法 | 第69-82页 |
·结构分析预处理 | 第69-70页 |
·结构分析算法 | 第70-77页 |
·公式结构的语法规则 | 第77-82页 |
·实验结果 | 第82-87页 |
·本章小结 | 第87-88页 |
第6章 中文文档识别软件MYOCR的设计与实现 | 第88-100页 |
·MYOCR算法库的设计方案 | 第88-93页 |
·算法语言及开发环境 | 第88-89页 |
·算法库的设计 | 第89-93页 |
·MYOCR功能及使用方法的介绍 | 第93-99页 |
·本章小结 | 第99-100页 |
结论 | 第100-102页 |
参考文献 | 第102-108页 |
攻读硕士学位期间发表的论文和取得的科研成果 | 第108-109页 |
致谢 | 第109页 |