英文科技文档中数学公式的定位、识别与重建
摘要 | 第1-6页 |
Abstract | 第6-11页 |
1 绪论 | 第11-29页 |
·文档图像分析概述 | 第11-13页 |
·文档图像分析的相关技术 | 第13-19页 |
·图像预处理 | 第13-14页 |
·去除噪声 | 第13页 |
·二值化 | 第13-14页 |
·倾斜矫正 | 第14页 |
·粘连字符分割 | 第14-15页 |
·连通成分标记 | 第15-16页 |
·版面分析和逻辑结构分析 | 第16-17页 |
·特征提取 | 第17页 |
·光学字符识别 | 第17-18页 |
·文档重建 | 第18-19页 |
·数学公式识别 | 第19-26页 |
·概述 | 第19页 |
·文档图像中数学公式的定位 | 第19-25页 |
·数学公式的识别与重建 | 第25-26页 |
·本文的主要工作 | 第26-29页 |
2 局部极大成分和标记算法 | 第29-45页 |
·灰度图像二值化 | 第29页 |
·连通和轮廓的定义 | 第29-30页 |
·轮廓追踪 | 第30-31页 |
·连通成分标记 | 第31-34页 |
·经典连通成分标记算法 | 第31-32页 |
·利用轮廓追踪技术的连通成分标记算法 | 第32-34页 |
·并行连通成分标记算法 | 第34页 |
·连通成分所在矩形标记 | 第34-35页 |
·局部极大成分标记 | 第35-41页 |
·局部极大成分的定义 | 第35-37页 |
·局部极大成分标记算法 | 第37-38页 |
·判断像素是否位于某个局部极大成分 | 第38-40页 |
·成分标记算法的部分并行化 | 第40-41页 |
·对比实验 | 第41-43页 |
·模拟算法在多CPU环境中的运行情况 | 第41-42页 |
·实验结果 | 第42-43页 |
·小结 | 第43-45页 |
3 文档图像中数学公式子图像的定位 | 第45-65页 |
·概述 | 第45-47页 |
·公式字图像定位算法详细流程 | 第47-53页 |
·分栏图像分割 | 第47页 |
·提取基准行 | 第47-48页 |
·文档图像的行分割与行合并 | 第48-50页 |
·图片(封闭边界表格)标记 | 第50-51页 |
·文本行处理 | 第51-53页 |
·成分排序及行内分割 | 第51页 |
·子区域分类 | 第51-52页 |
·生成最终公式标记结果 | 第52-53页 |
·公式定位实验结果 | 第53-57页 |
·与InftyReader的对比实验 | 第57-63页 |
·对比实验环境以及样本的准备 | 第57-59页 |
·对比实验结果分析 | 第59-63页 |
·小结 | 第63-65页 |
4 基于人工神经网络的数学公式识别、分析和重建 | 第65-91页 |
·人工神经网络概述 | 第65-67页 |
·数学公式识别中涉及的人工神经网络 | 第67-80页 |
·自组织特征映射神经网络 | 第67-69页 |
·网络拓扑结构及输入、输出 | 第68-69页 |
·学习过程及权值更新规则 | 第69页 |
·BP神经网络 | 第69-78页 |
·网络拓扑结构及输入、输出 | 第69-71页 |
·学习过程及权值更新规则 | 第71-72页 |
·关于梯度法收敛性的讨论 | 第72-78页 |
·主成分分析神经网络 | 第78-80页 |
·网络拓扑结构及输入、输出 | 第78页 |
·学习过程及权值更新规则 | 第78-80页 |
·数学公式中符号的识别 | 第80-87页 |
·符号的分离 | 第80-83页 |
·符号特征的提取 | 第83-85页 |
·字符图象归一化 | 第83页 |
·应用Zernike矩进行特征提取 | 第83-85页 |
·符号识别 | 第85-87页 |
·利用上下文无关文法实现数学公式的重建 | 第87-89页 |
·小结 | 第89-91页 |
结论 | 第91-93页 |
系统总结 | 第91-92页 |
未来应用 | 第92-93页 |
参考文献 | 第93-99页 |
附录A: 数学符号集 | 第99-101页 |
附录B: 描述数学公式的文法规则 | 第101-103页 |
附录C: 预测分析表 | 第103-105页 |
附录D: 预测分析程序的流程图 | 第105-107页 |
攻读博士学位期间发表学术论文情况 | 第107-109页 |
论文创新点摘要 | 第109-111页 |
致谢 | 第111-113页 |