印刷体中文文档识别系统的研究

摘要	第1-6页
ABSTRACT	第6-11页
第1章绪论	第11-21页
·课题研究的目的和意义	第11-12页
·印刷体中文文档识别技术的概述	第12页
·印刷体汉字识别系统	第12-14页
·汉字识别的分类	第13页
·印刷体汉字识别的研究历程	第13-14页
·印刷体中文文档中的公式识别技术	第14-18页
·公式识别的分类	第14-15页
·公式识别的研究历程	第15-18页
·印刷体中文文档识别中存在的困难	第18-19页
·本文的研究内容	第19-21页
第2章文档图像预处理	第21-31页
·图像二值化	第21-25页
·基于直方图谷点门限值的分割方法	第21页
·最大类间方差法	第21-22页
·最大熵法	第22-25页
·图像平滑去噪	第25-26页
·图像细化	第26-27页
·图像归一化	第27-30页
·位置归一化方法	第28页
·大小归一化方法	第28-30页
·本章小结	第30-31页
第3章版面分析	第31-44页
·版面分析的概述	第31-32页
·版面分析的算法	第32-36页
·基于组合特征的中文版面分析算法	第32-34页
·基于神经网络的版面分析算法	第34-35页
·基于多层次可信度指导下的自底向上版面分析算法	第35-36页
·系统版面分析算法的研究	第36-43页
·连通域级别	第37页
·文本行列级别	第37-38页
·区域级别	第38-39页
·实验结果	第39-43页
·本章小结	第43-44页
第4章印刷体汉字识别与表格识别	第44-59页
·印刷体汉字的特征提取	第44-47页
·汉字特征的分类	第44-45页
·常用的汉字特征	第45-47页
·印刷体汉字的分类器设计	第47-50页
·统计模式识别	第47-49页
·结构模式识别	第49页
·统计模式识别与结构模式识别的结合	第49页
·人工神经网络	第49-50页
·系统汉字识别的设计研究	第50-57页
·文本区域的处理	第50-52页
·多特征提取建立汉字模板库	第52页
·多分类器集成	第52-56页
·定位拒识字符	第56页
·实验结果	第56-57页
·系统表格识别的研究	第57-58页
·本章小结	第58-59页
第5章公式字符的定位分割、识别与结构分析	第59-88页
·中文文档中公式字符的定位方法	第59-64页
·现有公式定位方法的介绍	第59-60页
·独立行公式的定位	第60-61页
·内嵌行公式的定位	第61-64页
·公式字符的分割方法	第64-66页
·公式字符的特点	第64-65页
·公式字符的分割方法	第65-66页
·公式字符的识别方法	第66-69页
·公式字符的特征提取与选择	第67-68页
·建立字符模板库	第68页
·公式字符识别方法	第68-69页
·公式字符的结构分析方法	第69-82页
·结构分析预处理	第69-70页
·结构分析算法	第70-77页
·公式结构的语法规则	第77-82页
·实验结果	第82-87页
·本章小结	第87-88页
第6章中文文档识别软件MYOCR的设计与实现	第88-100页
·MYOCR算法库的设计方案	第88-93页
·算法语言及开发环境	第88-89页
·算法库的设计	第89-93页
·MYOCR功能及使用方法的介绍	第93-99页
·本章小结	第99-100页
结论	第100-102页
参考文献	第102-108页
攻读硕士学位期间发表的论文和取得的科研成果	第108-109页
致谢	第109页