| 摘要 | 第1-5页 |
| Abstract | 第5-9页 |
| 1.引言 | 第9-14页 |
| ·研究背景 | 第9-11页 |
| ·国内外研究现状及存在的问题 | 第11-12页 |
| ·本文要研究的内容及创新点 | 第12-13页 |
| ·本文的组织结构及总体框架图 | 第13-14页 |
| 2. 磁盘信息读取技术 | 第14-27页 |
| ·NTFS 的特点及基本概念 | 第14-15页 |
| ·NTFS 文件系统结构 | 第15-24页 |
| ·引导区结构 | 第16页 |
| ·MFT(Master File Table 主文件表)结构 | 第16-18页 |
| ·NTFS 下重要的属性结构 | 第18-23页 |
| ·目录结构分析 | 第23-24页 |
| ·磁盘信息读取算法 | 第24-26页 |
| ·本章小结 | 第26-27页 |
| 3. 文本信息提取技术 | 第27-50页 |
| ·OFFICE 系列文档格式解析 | 第27-41页 |
| ·复合文档格式 | 第28页 |
| ·复合文档的逻辑结构 | 第28页 |
| ·流结构 | 第28-30页 |
| ·文件头 OLESSHeader 结构解析 | 第30-32页 |
| ·目录(Directory)结构解析 | 第32-33页 |
| ·摘要结构解析 | 第33-35页 |
| ·WordBinaryDocuments 结构解析及内容提取 | 第35-39页 |
| ·PowerPointBinaryDocuments 结构解析及内容提取 | 第39-41页 |
| ·PDF 文档格式解析及内容提取 | 第41-49页 |
| ·PDF 对象 | 第41-42页 |
| ·PDF 物理结构 | 第42-45页 |
| ·PDF 逻辑结构 | 第45-46页 |
| ·PDF 文档解析流程 | 第46-48页 |
| ·PDF 内容提取 | 第48-49页 |
| ·文章小结 | 第49-50页 |
| 4. 基于多核处理器的并行匹配算法 | 第50-57页 |
| ·相关技术的应用 | 第50-52页 |
| ·并行搜索 | 第50页 |
| ·文本的编码方式及内容分割技术 | 第50-52页 |
| ·并行搜索模型 | 第52-54页 |
| ·并行循环搜索模型 | 第52-53页 |
| ·多线程并行模式 | 第53-54页 |
| ·实验结果与分析 | 第54-56页 |
| ·本章小结 | 第56-57页 |
| 5.总结与展望 | 第57-58页 |
| 参考文献 | 第58-61页 |
| 附录:攻读学位期间发表的学术论文及参与项目 | 第61-62页 |
| 致谢 | 第62-63页 |