摘要 | 第1-5页 |
Abstract | 第5-8页 |
1 绪论 | 第8-13页 |
·研究目的及意义 | 第8-9页 |
·国内外研究现状 | 第9-12页 |
·国内研究现状 | 第9-11页 |
·国外研究现状 | 第11-12页 |
·主要研究工作 | 第12-13页 |
2 各类文档元素在PDF 中的表示 | 第13-26页 |
·PDF 文档格式简介 | 第13-15页 |
·物理存储结构 | 第13-14页 |
·文件体的逻辑结构 | 第14-15页 |
·通用PDF 文档存储模块 | 第15-17页 |
·文本的表示 | 第17-21页 |
·字符串的描述 | 第17-18页 |
·TrueType 字体文件的嵌入 | 第18-21页 |
·字符串编码的映射 | 第21页 |
·图形元素的表示 | 第21-22页 |
·图像的表示 | 第22-23页 |
·结构化元素的表示 | 第23-25页 |
·小结 | 第25-26页 |
3 ScienceWord 文档到 PDF 的转换 | 第26-33页 |
·ScienceWord 文档的特点 | 第26-27页 |
·ScienceWord 中的科技文档对象 | 第27-29页 |
·ScienceWord 的 PDF 转换模块 | 第29-32页 |
·ScienceWord 文档树 | 第29-30页 |
·转换模块的设计 | 第30-32页 |
·小结 | 第32-33页 |
4 PDF 中 ScienceWord 文档逻辑信息的提取 | 第33-40页 |
·相关技术简介 | 第33-35页 |
·Acrobat plug-in sdk 简介 | 第33-34页 |
·MS XML DOM | 第34-35页 |
·文档逻辑信息的提取 | 第35-39页 |
·总体流程 | 第35页 |
·逻辑对象信息的提取 | 第35-38页 |
·逻辑对象的结构化表示 | 第38-39页 |
·修改DOM 树 | 第39页 |
·小结 | 第39-40页 |
5 原型系统的实现 | 第40-45页 |
·PDF 文档存储原型系统 | 第40-41页 |
·PDF 文档逻辑信息提取插件 | 第41页 |
·运行效果 | 第41-44页 |
·小结 | 第44-45页 |
6 总结与展望 | 第45-47页 |
·全文总结 | 第45页 |
·研究展望 | 第45-47页 |
致谢 | 第47-48页 |
参考文献 | 第48-52页 |
附录 攻读学位期间发表学术论文 | 第52页 |