面向医疗知识的PDF文本内容提取系统设计与实现

摘要	第4-5页
ABSTRACT	第5页
第1章绪论	第8-15页
1.1 课题来源及研究意义	第8-9页
1.2 与本课题相关的国内外研究综述	第9-13页
1.2.1 PDF文档国内外研究综述	第9-11页
1.2.2 医疗知识挖掘国内外研究综述	第11-13页
1.3 本论文的主要工作内容	第13页
1.4 本论文的组织结构	第13-15页
第2章 PDF文本内容提取系统基础理论和相关技术	第15-23页
2.1 PDF文档介绍	第15-20页
2.1.1 PDF概述	第15-16页
2.1.2 PDF文档格式	第16-19页
2.1.3 PDF文档示例	第19-20页
2.2 XML介绍	第20-22页
2.2.1 XML概述	第20-21页
2.2.2 XML文档示例	第21-22页
2.3 本章小结	第22-23页
第3章 PDF文本内容提取系统需求分析与概要设计	第23-31页
3.1 PDF文本内容提取系统需求分析	第23-27页
3.1.1 总体需求分析	第23-25页
3.1.2 TXT转换模块功能需求分析	第25-26页
3.1.3 XML转换模块功能需求分析	第26-27页
3.1.4 系统非功能性需求分析	第27页
3.2 PDF文本内容提取系统总体设计	第27-30页
3.2.1 系统功能模块设计	第27-29页
3.2.2 系统体系架构设计	第29-30页
3.3 本章小结	第30-31页
第4章 PDF文本内容提取系统的详细设计及实现	第31-49页
4.1 系统开发环境和开发工具	第31页
4.2 TXT转换模块详细设计与实现	第31-44页
4.2.1 TXT转换模块总体方案设计与实现	第31-33页
4.2.2 文件夹遍历操作	第33-34页
4.2.3 定位到关键位置	第34-37页
4.2.4 数据流解码	第37-40页
4.2.5 Stream流解码后的字符串	第40页
4.2.6 PDF文本内容提取	第40-44页
4.3 XML转换模块详细设计与实现	第44-48页
4.3.1 XML转换模块框架设计	第44页
4.3.2 语义模型设计	第44-46页
4.3.3 XML格式转换流程设计与实现	第46-48页
4.4 本章小结	第48-49页
第5章 PDF文本内容提取系统测试	第49-55页
5.1 测试方案	第49-50页
5.2 系统功能测试	第50-51页
5.2.1 TXT转换模块测试	第50-51页
5.2.2 XML转换模块测试	第51页
5.3 系统性能测试	第51-53页
5.4 测试结论	第53-54页
5.5 本章小结	第54-55页
结论	第55-57页
参考文献	第57-62页
致谢	第62-63页
个人简历	第63页