摘要 | 第3-4页 |
ABSTRACT | 第4-5页 |
第一章 绪论 | 第8-13页 |
1.1 背景介绍 | 第8-11页 |
1.1.1 XML 信息检索的研究现状与研究意义 | 第8-10页 |
1.1.2 本文主要内容 | 第10-11页 |
1.2 论文结构 | 第11-13页 |
第二章 相关技术 | 第13-28页 |
2.1 XML 概述 | 第13-15页 |
2.2 Berkeley DB 概述 | 第15-20页 |
2.2.1 Berkeley DB 的核心数据结构 | 第15-16页 |
2.2.2 Berkeley DB 数据访问算法 | 第16-20页 |
2.3 Berkeley DB XML 概述 | 第20-22页 |
2.3.1 XML 文档存储 | 第21-22页 |
2.3.2 XML 文档索引 | 第22页 |
2.3.3 XML 文档查询访问 | 第22页 |
2.4 VTD-XML 解析技术 | 第22-23页 |
2.5 Trie 树 | 第23-25页 |
2.6 XQuery 技术概述 | 第25-28页 |
第三章 平台简介 | 第28-33页 |
3.1 平台概述 | 第28-29页 |
3.2 平台功能模块 | 第29-32页 |
3.3 平台算法概述 | 第32-33页 |
第四章 XObject 检索算法的设计与实现 | 第33-49页 |
4.1 多文档 XObject 检索算法概述 | 第33-34页 |
4.2 BDB 存储设计 | 第34-35页 |
4.3 XML 文档结构解析 | 第35-36页 |
4.4 XML 结构聚类 | 第36-44页 |
4.4.1 XML 文档结构聚类研究现状 | 第36-37页 |
4.4.2 改进后的 Trie 树 | 第37-39页 |
4.4.3 基于 Trie 匹配的结构聚类 | 第39-41页 |
4.4.4 双亲存储法优化聚类结构存储空间 | 第41-43页 |
4.4.5 聚类文档 BDB XML 存储 | 第43-44页 |
4.5 动态构建查询路径 | 第44-47页 |
4.5.1 关键词预处理 | 第44-45页 |
4.5.2 动态构建查询路径 | 第45-47页 |
4.5.3 返回相关检索与热门词汇 | 第47页 |
4.6 XQuery 查询 | 第47-48页 |
4.7 结果排序 | 第48-49页 |
第五章 SLCAOffset 检索算法的设计与实现 | 第49-59页 |
5.1 SLCA 算法概述 | 第49页 |
5.2 改进后的 SLCAOffset 算法概述 | 第49-51页 |
5.3 BDB 存储设计 | 第51-52页 |
5.4 XML 文档解析 | 第52-54页 |
5.5 XML 文档存储 | 第54页 |
5.6 关键词检索 | 第54-58页 |
5.6.1 关键词检索概述 | 第54-56页 |
5.6.2 求相关度最高的 id 组合 | 第56页 |
5.6.3 tokenId 汇聚 | 第56-57页 |
5.6.4 从 TokensRecordDB 中取 tokenRecord | 第57-58页 |
5.6.5 根据偏移量读取结果片段 | 第58页 |
5.7 结果排序 | 第58-59页 |
第六章 测试与实验结果分析 | 第59-64页 |
6.1 XObject 算法测试 | 第59-61页 |
6.1.1 聚类效果分析 | 第59-60页 |
6.1.2 调节相似度阀值后的聚类效果分析 | 第60页 |
6.1.3 双亲存储空间优化分析 | 第60-61页 |
6.2 SLCAOffset 算法测试 | 第61-64页 |
6.2.1 存储块大小测试分析 | 第61-64页 |
第七章 结论与展望 | 第64-67页 |
7.1 结论 | 第64页 |
7.2 前景展望 | 第64-67页 |
参考文献 | 第67-71页 |
发表论文和参加科研情况说明 | 第71-72页 |
致谢 | 第72页 |