印刷体中文文档识别系统的研究
| 摘要 | 第1-6页 |
| ABSTRACT | 第6-11页 |
| 第1章 绪论 | 第11-21页 |
| ·课题研究的目的和意义 | 第11-12页 |
| ·印刷体中文文档识别技术的概述 | 第12页 |
| ·印刷体汉字识别系统 | 第12-14页 |
| ·汉字识别的分类 | 第13页 |
| ·印刷体汉字识别的研究历程 | 第13-14页 |
| ·印刷体中文文档中的公式识别技术 | 第14-18页 |
| ·公式识别的分类 | 第14-15页 |
| ·公式识别的研究历程 | 第15-18页 |
| ·印刷体中文文档识别中存在的困难 | 第18-19页 |
| ·本文的研究内容 | 第19-21页 |
| 第2章 文档图像预处理 | 第21-31页 |
| ·图像二值化 | 第21-25页 |
| ·基于直方图谷点门限值的分割方法 | 第21页 |
| ·最大类间方差法 | 第21-22页 |
| ·最大熵法 | 第22-25页 |
| ·图像平滑去噪 | 第25-26页 |
| ·图像细化 | 第26-27页 |
| ·图像归一化 | 第27-30页 |
| ·位置归一化方法 | 第28页 |
| ·大小归一化方法 | 第28-30页 |
| ·本章小结 | 第30-31页 |
| 第3章 版面分析 | 第31-44页 |
| ·版面分析的概述 | 第31-32页 |
| ·版面分析的算法 | 第32-36页 |
| ·基于组合特征的中文版面分析算法 | 第32-34页 |
| ·基于神经网络的版面分析算法 | 第34-35页 |
| ·基于多层次可信度指导下的自底向上版面分析算法 | 第35-36页 |
| ·系统版面分析算法的研究 | 第36-43页 |
| ·连通域级别 | 第37页 |
| ·文本行列级别 | 第37-38页 |
| ·区域级别 | 第38-39页 |
| ·实验结果 | 第39-43页 |
| ·本章小结 | 第43-44页 |
| 第4章 印刷体汉字识别与表格识别 | 第44-59页 |
| ·印刷体汉字的特征提取 | 第44-47页 |
| ·汉字特征的分类 | 第44-45页 |
| ·常用的汉字特征 | 第45-47页 |
| ·印刷体汉字的分类器设计 | 第47-50页 |
| ·统计模式识别 | 第47-49页 |
| ·结构模式识别 | 第49页 |
| ·统计模式识别与结构模式识别的结合 | 第49页 |
| ·人工神经网络 | 第49-50页 |
| ·系统汉字识别的设计研究 | 第50-57页 |
| ·文本区域的处理 | 第50-52页 |
| ·多特征提取建立汉字模板库 | 第52页 |
| ·多分类器集成 | 第52-56页 |
| ·定位拒识字符 | 第56页 |
| ·实验结果 | 第56-57页 |
| ·系统表格识别的研究 | 第57-58页 |
| ·本章小结 | 第58-59页 |
| 第5章 公式字符的定位分割、识别与结构分析 | 第59-88页 |
| ·中文文档中公式字符的定位方法 | 第59-64页 |
| ·现有公式定位方法的介绍 | 第59-60页 |
| ·独立行公式的定位 | 第60-61页 |
| ·内嵌行公式的定位 | 第61-64页 |
| ·公式字符的分割方法 | 第64-66页 |
| ·公式字符的特点 | 第64-65页 |
| ·公式字符的分割方法 | 第65-66页 |
| ·公式字符的识别方法 | 第66-69页 |
| ·公式字符的特征提取与选择 | 第67-68页 |
| ·建立字符模板库 | 第68页 |
| ·公式字符识别方法 | 第68-69页 |
| ·公式字符的结构分析方法 | 第69-82页 |
| ·结构分析预处理 | 第69-70页 |
| ·结构分析算法 | 第70-77页 |
| ·公式结构的语法规则 | 第77-82页 |
| ·实验结果 | 第82-87页 |
| ·本章小结 | 第87-88页 |
| 第6章 中文文档识别软件MYOCR的设计与实现 | 第88-100页 |
| ·MYOCR算法库的设计方案 | 第88-93页 |
| ·算法语言及开发环境 | 第88-89页 |
| ·算法库的设计 | 第89-93页 |
| ·MYOCR功能及使用方法的介绍 | 第93-99页 |
| ·本章小结 | 第99-100页 |
| 结论 | 第100-102页 |
| 参考文献 | 第102-108页 |
| 攻读硕士学位期间发表的论文和取得的科研成果 | 第108-109页 |
| 致谢 | 第109页 |