摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
第一章 绪论 | 第12-34页 |
1.1 研究背景及意义 | 第13-21页 |
1.1.1 不确定数据产生的原因 | 第13-14页 |
1.1.2 概率XML数据模型 | 第14-19页 |
1.1.3 概率XML数据面临的挑战 | 第19-21页 |
1.2 相关技术及研究成果 | 第21-30页 |
1.2.1 XML数据编码 | 第21-24页 |
1.2.2 XML数据索引技术 | 第24-25页 |
1.2.3 XML关键字检索结果集 | 第25-30页 |
1.3 本文的主要贡献 | 第30-31页 |
1.4 本文的组织结构 | 第31-34页 |
第二章 基于概率分布的概率ELCA关键字检索算法 | 第34-56页 |
2.1 引言 | 第34-35页 |
2.2 问题描述 | 第35-37页 |
2.3 概率的计算 | 第37-44页 |
2.3.1 节点概率分布 | 第37-41页 |
2.3.2 概率ELCA节点的概率 | 第41-44页 |
2.4 概率ELCA检索算法 | 第44-49页 |
2.4.1 概率编码 | 第44-46页 |
2.4.2 算法实现 | 第46-49页 |
2.5 实验测试及性能分析 | 第49-54页 |
2.5.1 数据集 | 第49-51页 |
2.5.2 查全率测试 | 第51-52页 |
2.5.3 查询时间测试 | 第52-54页 |
2.6 本章小节 | 第54-56页 |
第三章 基于概率剪枝的概率ELCA关键字检索算法 | 第56-72页 |
3.1 引言 | 第56页 |
3.2 问题定义 | 第56页 |
3.3 概率上下界 | 第56-63页 |
3.3.1 节点概率分布 | 第57-60页 |
3.3.2 概率上界 | 第60-62页 |
3.3.3 概率下界 | 第62-63页 |
3.3.4 节点概率更新 | 第63页 |
3.4 概率阈值检索算法 | 第63-68页 |
3.5 实验测试及性能分析 | 第68-71页 |
3.5.1 测试数据集 | 第68页 |
3.5.2 运行时间测试 | 第68-71页 |
3.6 本章小节 | 第71-72页 |
第四章 概率XML数据上基于距离的关键字检索算法 | 第72-94页 |
4.1 引言 | 第72页 |
4.2 最近邻关键字 | 第72-84页 |
4.2.1 问题描述 | 第73-77页 |
4.2.2 PNK节点划分 | 第77-79页 |
4.2.3 剪枝策略 | 第79-82页 |
4.2.4 节点索引结构 | 第82-84页 |
4.3 PNK检索算法实现 | 第84-87页 |
4.4 基于距离的关键字检索 | 第87-88页 |
4.5 实验测试及性能分析 | 第88-92页 |
4.5.1 测试数据集 | 第89页 |
4.5.2 查全率测试 | 第89-90页 |
4.5.3 基于节点分类的测试 | 第90-91页 |
4.5.4 基于概率阈值的测试 | 第91-92页 |
4.6 本章小节 | 第92-94页 |
第五章 概率XML数据上的SLCA关键字检索排序算法 | 第94-108页 |
5.1 引言 | 第94-95页 |
5.2 问题描述 | 第95-96页 |
5.3 概率XML上的SLCA关键字检索排序算法 | 第96-100页 |
5.3.1 关键字结果排序影响因素 | 第97-100页 |
5.3.2 计算模型 | 第100页 |
5.4 排序算法实现 | 第100-102页 |
5.5 实验测试及性能分析 | 第102-106页 |
5.5.1 数据集 | 第102-103页 |
5.5.2 查全率测试 | 第103-104页 |
5.5.3 运行时间测试 | 第104-106页 |
5.6 本章小节 | 第106-108页 |
第六章 结束语 | 第108-112页 |
6.1 本文工作总结 | 第108-109页 |
6.2 未来的研究方向 | 第109-112页 |
参考文献 | 第112-126页 |
致谢 | 第126-128页 |
攻博期间发表的论文 | 第128-130页 |
科研经历 | 第130-132页 |
作者简介 | 第132页 |