摘要 | 第5-6页 |
Abstract | 第6-7页 |
第一章 绪论 | 第10-16页 |
1.1 研究背景与意义 | 第10-11页 |
1.2 国内外研究现状 | 第11-13页 |
1.2.1 国外全文检索技术发展状况 | 第11页 |
1.2.2 国内全文检索技术发展状况 | 第11-13页 |
1.3 本文研究内容及创新点 | 第13-15页 |
1.3.1 研究内容 | 第13页 |
1.3.2 论文结构 | 第13-14页 |
1.3.3 主要工作 | 第14-15页 |
1.4 本章小结 | 第15-16页 |
第二章 基于非结构化文本的索引关系建立方法研究 | 第16-40页 |
2.1 文本检索索引的组织 | 第16-23页 |
2.1.1 索引基础 | 第16页 |
2.1.2 字符-文档矩阵 | 第16-17页 |
2.1.3 正排索引 | 第17-19页 |
2.1.4 倒排索引 | 第19-23页 |
2.2 索引构建 | 第23-26页 |
2.2.1 文档单位的选择 | 第23-25页 |
2.2.2 单词词典 | 第25页 |
2.2.3 哈希加链表 | 第25-26页 |
2.2.4 树形结构 | 第26页 |
2.3 索引构建算法 | 第26-35页 |
2.3.1 两遍文档遍历法 | 第26-30页 |
2.3.2 排序法 | 第30-34页 |
2.3.3 归并法 | 第34-35页 |
2.4 信息检索模型及方法 | 第35-39页 |
2.4.1 布尔检索模型 | 第35-37页 |
2.4.2 布尔检索模型扩展 | 第37页 |
2.4.3 基于跳表的倒排记录表快速合并算法 | 第37-39页 |
2.5 本章小结 | 第39-40页 |
第三章 实验系统的设计与实现 | 第40-66页 |
3.1 倒排索引的构建 | 第40-47页 |
3.1.1 基于归并法的倒排索引的构建 | 第40-43页 |
3.1.2 倒排索引文件构建流程图 | 第43-45页 |
3.1.3 倒排索引文件建立测试说明 | 第45-47页 |
3.2 对单个文档建立对应的单个倒排索引 | 第47-54页 |
3.2.1 单个文档建立倒排索引方法 | 第47-48页 |
3.2.2 单个文档建立倒排索引文件流程图 | 第48-52页 |
3.2.3 单个文档建立倒排索引文件测试说明 | 第52-54页 |
3.3 分级索引 | 第54-56页 |
3.3.1 分级索引构建数学模型 | 第54-55页 |
3.3.2 分级索引建立测试说明 | 第55-56页 |
3.4 查询优化设计 | 第56-64页 |
3.4.1 在分级索引中进行关键词检索 | 第56-57页 |
3.4.2 一级索引检索关键词实现方式 | 第57-60页 |
3.4.3 一级索引检索关键词流程图 | 第60页 |
3.4.4 一级索引检索关键词测试说明 | 第60-61页 |
3.4.5 三级索引检索关键词实现方式 | 第61-63页 |
3.4.6 三级索引检索关键词流程图 | 第63-64页 |
3.4.7 三级索引检索关键词测试说明 | 第64页 |
3.5 本章小结 | 第64-66页 |
第四章 实验系统测试 | 第66-76页 |
4.1 实验系统性能测试 | 第66-69页 |
4.1.1 实验系统的实验环境 | 第66页 |
4.1.2 实验系统性能测试与分析 | 第66-69页 |
4.2 实验结果对比 | 第69-74页 |
4.3 本章小结 | 第74-76页 |
第五章 总结与展望 | 第76-78页 |
5.1 总结 | 第76-77页 |
5.2 展望 | 第77-78页 |
致谢 | 第78-80页 |
参考文献 | 第80-84页 |
附录A(攻读硕士学位期间主要成果) | 第84-86页 |
附录B | 第86-118页 |
附录B.1:建立以单个字符的倒排索引的部分源码 | 第86-91页 |
附录B.2:文本名称及路径写入文本源码 | 第91-93页 |
附录B.3:对每个文本建立对应位置倒排索引部分源码 | 第93-96页 |
附录B.4:建立二级索引部分源码 | 第96-100页 |
附录B.5:不同文本建立倒排索引文件消耗时间部分源码 | 第100-101页 |
附录B.6:文本拆分部分源码 | 第101-103页 |
附录B.7:建立三级索引部分源码 | 第103-105页 |
附录B.8:在两级索引结构中进行关键词检索部分源码 | 第105-109页 |
附录B.9:在三级索引中进行关键词检索部分源码 | 第109-113页 |
附录B.10:不同索引结构中检索测试结果 | 第113-118页 |