印刷体文档中的数学公式识别算法的研究
摘要 | 第4-5页 |
Abstract | 第5页 |
第一章 绪论 | 第8-13页 |
1.1 研究的背景和意义 | 第8页 |
1.2 国内外研究现状 | 第8-10页 |
1.3 数学公式识别的难点 | 第10-11页 |
1.4 数学公式识别的过程 | 第11-12页 |
1.5 论文完成工作与章节安排 | 第12-13页 |
第二章 数学公式的定位 | 第13-30页 |
2.1 公式图像预处理 | 第13-16页 |
2.2 文档中公式类型及特点 | 第16-17页 |
2.3 基于字符宽度中心矩的公式定位算法 | 第17-26页 |
2.3.1 提取公式文本行 | 第17-22页 |
2.3.2 独立型公式定位 | 第22页 |
2.3.3 内嵌型公式定位 | 第22页 |
2.3.4 算法实现与定位结果 | 第22-26页 |
2.4 基于汉字拒识的内嵌型公式定位算法 | 第26-28页 |
2.4.1 内嵌型公式定位 | 第26-27页 |
2.4.2 算法实现与定位结果 | 第27-28页 |
2.5 公式定位整体算法与结果 | 第28-29页 |
2.6 本章小结 | 第29-30页 |
第三章 公式字符切分与识别 | 第30-46页 |
3.1 公式字符切分 | 第30-37页 |
3.1.1 投影分割法 | 第30-33页 |
3.1.2 连通域分割法 | 第33-35页 |
3.1.3 公式字符切分方法与结果 | 第35-37页 |
3.2 公式字符识别 | 第37-45页 |
3.2.1 公式字符图像预处理 | 第37-41页 |
3.2.2 特征提取 | 第41-42页 |
3.2.3 建立模板库 | 第42-43页 |
3.2.4 模板匹配方法 | 第43-44页 |
3.2.5 识别结果 | 第44-45页 |
3.3 本章小结 | 第45-46页 |
第四章 公式结构分析 | 第46-59页 |
4.1 公式结构分析的难点 | 第46-47页 |
4.2 结构分析前预处理 | 第47-49页 |
4.2.1 符号位置特征与坐标标定 | 第47页 |
4.2.2 字符多行判断 | 第47-49页 |
4.3 已有公式结构分析方法概述 | 第49-50页 |
4.4 基于特征字符的公式结构分析方法 | 第50-57页 |
4.4.1 特征字符的定义与分类 | 第50-52页 |
4.4.2 特征子块的合并算法 | 第52-56页 |
4.4.3 结构分析整体算法 | 第56-57页 |
4.5 算法举例 | 第57-58页 |
4.6 本章小结 | 第58-59页 |
第五章 公式表示方法 | 第59-69页 |
5.1 常见的公式表示方法 | 第59-60页 |
5.1.1 Tex语言 | 第59页 |
5.1.2 MathML语言 | 第59-60页 |
5.1.3 Word EQ域 | 第60页 |
5.2 EQ域表示数学公式 | 第60-63页 |
5.2.1 数组表示 | 第61页 |
5.2.2 括号使用 | 第61页 |
5.2.3 积分、求和、求积表达式 | 第61-62页 |
5.2.4 分数表达式 | 第62页 |
5.2.5 根号表达式 | 第62-63页 |
5.2.6 上角标或下角标 | 第63页 |
5.3 公式识别结果 | 第63-68页 |
5.4 本章小结 | 第68-69页 |
第六章 总结与展望 | 第69-71页 |
6.1 总结 | 第69-70页 |
6.2 展望 | 第70-71页 |
参考文献 | 第71-74页 |
附录1 插图清单 | 第74-76页 |
附录2 插表清单 | 第76-77页 |
在学研究成果 | 第77-78页 |
致谢 | 第78页 |