PDF文档语义信息抽取研究

第1章绪论	第1-12页
·研究背景	第7-9页
·研究现状	第9-11页
·研究目标	第11页
·论文结构	第11-12页
第2章相关技术介绍	第12-19页
·关于PDF	第12-14页
·对PDF的转换技术	第14-15页
·PDF文档视图和选中文本的获取	第15-16页
·关于XML及DOM、SAX	第16-19页
·XML	第16-17页
·DOM & SAX	第17-19页
第三章 PDF文档语义信息抽取原理和方法	第19-39页
·体系结构	第19-22页
·PDF模块	第20-21页
·PDF库	第21-22页
·语义模型	第22-24页
·PDF文档语义信息抽取过程	第24-38页
·PDF文档预处理模块	第25-26页
·样本学习模块	第26-35页
·信息抽取模块	第35-38页
·小结	第38-39页
第四章实验环境及测试	第39-42页
·性能测试	第39-40页
·小结	第40-42页
第5章结论	第42-43页
参考文献	第43-46页
致谢	第46-47页