摘要 | 第1-5页 |
Abstract | 第5-9页 |
1.引言 | 第9-14页 |
·研究背景 | 第9-11页 |
·国内外研究现状及存在的问题 | 第11-12页 |
·本文要研究的内容及创新点 | 第12-13页 |
·本文的组织结构及总体框架图 | 第13-14页 |
2. 磁盘信息读取技术 | 第14-27页 |
·NTFS 的特点及基本概念 | 第14-15页 |
·NTFS 文件系统结构 | 第15-24页 |
·引导区结构 | 第16页 |
·MFT(Master File Table 主文件表)结构 | 第16-18页 |
·NTFS 下重要的属性结构 | 第18-23页 |
·目录结构分析 | 第23-24页 |
·磁盘信息读取算法 | 第24-26页 |
·本章小结 | 第26-27页 |
3. 文本信息提取技术 | 第27-50页 |
·OFFICE 系列文档格式解析 | 第27-41页 |
·复合文档格式 | 第28页 |
·复合文档的逻辑结构 | 第28页 |
·流结构 | 第28-30页 |
·文件头 OLESSHeader 结构解析 | 第30-32页 |
·目录(Directory)结构解析 | 第32-33页 |
·摘要结构解析 | 第33-35页 |
·WordBinaryDocuments 结构解析及内容提取 | 第35-39页 |
·PowerPointBinaryDocuments 结构解析及内容提取 | 第39-41页 |
·PDF 文档格式解析及内容提取 | 第41-49页 |
·PDF 对象 | 第41-42页 |
·PDF 物理结构 | 第42-45页 |
·PDF 逻辑结构 | 第45-46页 |
·PDF 文档解析流程 | 第46-48页 |
·PDF 内容提取 | 第48-49页 |
·文章小结 | 第49-50页 |
4. 基于多核处理器的并行匹配算法 | 第50-57页 |
·相关技术的应用 | 第50-52页 |
·并行搜索 | 第50页 |
·文本的编码方式及内容分割技术 | 第50-52页 |
·并行搜索模型 | 第52-54页 |
·并行循环搜索模型 | 第52-53页 |
·多线程并行模式 | 第53-54页 |
·实验结果与分析 | 第54-56页 |
·本章小结 | 第56-57页 |
5.总结与展望 | 第57-58页 |
参考文献 | 第58-61页 |
附录:攻读学位期间发表的学术论文及参与项目 | 第61-62页 |
致谢 | 第62-63页 |