基于BDB的XML信息检索引擎平台设计与实现

摘要	第3-4页
ABSTRACT	第4-5页
第一章绪论	第8-13页
1.1 背景介绍	第8-11页
1.1.1 XML 信息检索的研究现状与研究意义	第8-10页
1.1.2 本文主要内容	第10-11页
1.2 论文结构	第11-13页
第二章相关技术	第13-28页
2.1 XML 概述	第13-15页
2.2 Berkeley DB 概述	第15-20页
2.2.1 Berkeley DB 的核心数据结构	第15-16页
2.2.2 Berkeley DB 数据访问算法	第16-20页
2.3 Berkeley DB XML 概述	第20-22页
2.3.1 XML 文档存储	第21-22页
2.3.2 XML 文档索引	第22页
2.3.3 XML 文档查询访问	第22页
2.4 VTD-XML 解析技术	第22-23页
2.5 Trie 树	第23-25页
2.6 XQuery 技术概述	第25-28页
第三章平台简介	第28-33页
3.1 平台概述	第28-29页
3.2 平台功能模块	第29-32页
3.3 平台算法概述	第32-33页
第四章 XObject 检索算法的设计与实现	第33-49页
4.1 多文档 XObject 检索算法概述	第33-34页
4.2 BDB 存储设计	第34-35页
4.3 XML 文档结构解析	第35-36页
4.4 XML 结构聚类	第36-44页
4.4.1 XML 文档结构聚类研究现状	第36-37页
4.4.2 改进后的 Trie 树	第37-39页
4.4.3 基于 Trie 匹配的结构聚类	第39-41页
4.4.4 双亲存储法优化聚类结构存储空间	第41-43页
4.4.5 聚类文档 BDB XML 存储	第43-44页
4.5 动态构建查询路径	第44-47页
4.5.1 关键词预处理	第44-45页
4.5.2 动态构建查询路径	第45-47页
4.5.3 返回相关检索与热门词汇	第47页
4.6 XQuery 查询	第47-48页
4.7 结果排序	第48-49页
第五章 SLCAOffset 检索算法的设计与实现	第49-59页
5.1 SLCA 算法概述	第49页
5.2 改进后的 SLCAOffset 算法概述	第49-51页
5.3 BDB 存储设计	第51-52页
5.4 XML 文档解析	第52-54页
5.5 XML 文档存储	第54页
5.6 关键词检索	第54-58页
5.6.1 关键词检索概述	第54-56页
5.6.2 求相关度最高的 id 组合	第56页
5.6.3 tokenId 汇聚	第56-57页
5.6.4 从 TokensRecordDB 中取 tokenRecord	第57-58页
5.6.5 根据偏移量读取结果片段	第58页
5.7 结果排序	第58-59页
第六章测试与实验结果分析	第59-64页
6.1 XObject 算法测试	第59-61页
6.1.1 聚类效果分析	第59-60页
6.1.2 调节相似度阀值后的聚类效果分析	第60页
6.1.3 双亲存储空间优化分析	第60-61页
6.2 SLCAOffset 算法测试	第61-64页
6.2.1 存储块大小测试分析	第61-64页
第七章结论与展望	第64-67页
7.1 结论	第64页
7.2 前景展望	第64-67页
参考文献	第67-71页
发表论文和参加科研情况说明	第71-72页
致谢	第72页