网络中文PDF文件保密审查系统设计与实现

摘要	第5-6页
abstract	第6页
第1章绪论	第9-13页
1.1 课题背景	第9-10页
1.2 研究内容	第10-11页
1.3 国内外研究现状	第11页
1.4 课题的意义	第11页
1.5 论文研究内容和组织结构	第11-13页
第2章研究背景及问题	第13-22页
2.1 PDF文档解析技术	第13-19页
2.1.1 PDF文档结构	第13-15页
2.1.2 PDF文档字符编码	第15页
2.1.3 PDF文档中文字符编码及转码映射文件	第15-16页
2.1.4 PDF文档文本内容提取相关技术	第16-17页
2.1.5 网络PDF文档的解析	第17-18页
2.1.6 网络中PDF文档内容流定位问题	第18-19页
2.1.7 中文PDF文档转码映射问题	第19页
2.2 精确单模式匹配问题	第19-20页
2.3 本章小结	第20-22页
第3章 PDF文档内容流的快速定位技术	第22-35页
3.1 PDF文档内容流定位问题	第22-23页
3.2 PDF文档内容流标签的快速定位算法	第23-30页
3.2.1 基于模式串跳跃的快速单模串匹配算法	第24-27页
3.2.2 网络流环境PDF文档内容流定位处理方法	第27-30页
3.3 实验结果与分析	第30-34页
3.3.1 实验环境	第30-31页
3.3.2 PDF文档内容流定位模拟实验及分析	第31页
3.3.3 网络PDF文档内容流定位实验及分析	第31-34页
3.4 本章小结	第34-35页
第4章中文PDF文档高效转码技术	第35-53页
4.1 引言	第35-38页
4.2 中文PDF文档转码关键技术研究	第38-46页
4.2.1 基于直接映射的转码方式	第39页
4.2.2 基于红黑树的转码	第39-42页
4.2.3 中文PDF文档转码映射表的内存使用问题	第42-43页
4.2.4 内存管理的申请和释放机制	第43-44页
4.2.5 基于多级队列的内存使用表	第44-46页
4.3 实验与结果分析	第46-52页
4.3.1 实验环境	第46页
4.3.2 中文PDF文档转码模拟实验	第46-49页
4.3.3 中文PDF文档转码节点内存管理仿真实验	第49-52页
4.4 本章小结	第52-53页
第5章系统设计与实现	第53-60页
5.1 保密审查系统整体结构概述	第53-55页
5.2 中文PDF文档解析处理流程图	第55-58页
5.3 中文PDF文档解析主要数据结构与接口设计	第58-59页
5.4 本章小结	第59-60页
结论	第60-61页
参考文献	第61-65页
致谢	第65页