ScienceWord软件中PDF文档的生成及其内容提取研究

摘要	第1-5页
Abstract	第5-8页
1 绪论	第8-13页
·研究目的及意义	第8-9页
·国内外研究现状	第9-12页
·国内研究现状	第9-11页
·国外研究现状	第11-12页
·主要研究工作	第12-13页
2 各类文档元素在PDF 中的表示	第13-26页
·PDF 文档格式简介	第13-15页
·物理存储结构	第13-14页
·文件体的逻辑结构	第14-15页
·通用PDF 文档存储模块	第15-17页
·文本的表示	第17-21页
·字符串的描述	第17-18页
·TrueType 字体文件的嵌入	第18-21页
·字符串编码的映射	第21页
·图形元素的表示	第21-22页
·图像的表示	第22-23页
·结构化元素的表示	第23-25页
·小结	第25-26页
3 ScienceWord 文档到 PDF 的转换	第26-33页
·ScienceWord 文档的特点	第26-27页
·ScienceWord 中的科技文档对象	第27-29页
·ScienceWord 的 PDF 转换模块	第29-32页
·ScienceWord 文档树	第29-30页
·转换模块的设计	第30-32页
·小结	第32-33页
4 PDF 中 ScienceWord 文档逻辑信息的提取	第33-40页
·相关技术简介	第33-35页
·Acrobat plug-in sdk 简介	第33-34页
·MS XML DOM	第34-35页
·文档逻辑信息的提取	第35-39页
·总体流程	第35页
·逻辑对象信息的提取	第35-38页
·逻辑对象的结构化表示	第38-39页
·修改DOM 树	第39页
·小结	第39-40页
5 原型系统的实现	第40-45页
·PDF 文档存储原型系统	第40-41页
·PDF 文档逻辑信息提取插件	第41页
·运行效果	第41-44页
·小结	第44-45页
6 总结与展望	第45-47页
·全文总结	第45页
·研究展望	第45-47页
致谢	第47-48页
参考文献	第48-52页
附录攻读学位期间发表学术论文	第52页