摘要 | 第1-5页 |
Abstract | 第5-9页 |
1 绪论 | 第9-23页 |
·文档图像分析 | 第9-11页 |
·文档图像分析概述 | 第9-10页 |
·文档图像分析设计的相关技术 | 第10-11页 |
·模式识别 | 第11-15页 |
·模式识别基本概念 | 第11-12页 |
·模式识别几种主要方法的比较 | 第12-14页 |
·神经网络方法解决模式识别问题的基本步骤 | 第14-15页 |
·人工神经网络 | 第15-20页 |
·神经网络的分类 | 第16-17页 |
·神经网络的特性 | 第17-18页 |
·神经网络的学习方式和学习规则 | 第18-20页 |
·本文的主要工作 | 第20-23页 |
2 基于人工神经网络的数学公式符号的识别 | 第23-31页 |
·BP神经网络 | 第23-26页 |
·BP神经网络的结构 | 第23-24页 |
·BP神经网络的权值更新 | 第24-26页 |
·用Zernike矩进行特征提取 | 第26-28页 |
·数学符号的识别 | 第28-31页 |
3 中文环境中数学公式的抽取 | 第31-43页 |
·该领域研究概况及相关问题 | 第31-34页 |
·现有算法介绍 | 第31-32页 |
·标记连通体的讨论 | 第32页 |
·对人类阅读方式的借鉴 | 第32-33页 |
·公式分布局部性及中文科技文档的特性 | 第33-34页 |
·公式抽取新算法的特点 | 第34-37页 |
·规避画连通体步骤 | 第34-35页 |
·并行读入字符 | 第35页 |
·将公式定位过程分为三种状态 | 第35-37页 |
·详细步骤 | 第37-40页 |
·获取标准字高heightStd及标准行空隙heightGapStd | 第37页 |
·获取标准字宽widthStd及标准字空隙widthGapStd | 第37-38页 |
·通过投影数据抽取独立公式行 | 第38页 |
·汉字的确认 | 第38页 |
·整体算法流程 | 第38-40页 |
·数学公式定位试验 | 第40-43页 |
结论 | 第43-45页 |
参考文献 | 第45-49页 |
攻读硕士学位期间学术论文完成情况 | 第49-51页 |
致谢 | 第51-53页 |