摘要 | 第5-7页 |
ABSTRACT | 第7-9页 |
第一章 绪论 | 第20-30页 |
1.1 研究背景 | 第20-21页 |
1.2 国内外研究现状 | 第21-25页 |
1.2.1 早期语义Web搜索系统 | 第21页 |
1.2.2 面向大规模RDF数据的语义搜索 | 第21-25页 |
1.3 本文拟解决的问题 | 第25-26页 |
1.4 本文内容和贡献 | 第26-30页 |
第二章 基于信息检索的方法来搜索数据万维网 | 第30-54页 |
2.1 引言 | 第30页 |
2.2 概述 | 第30-32页 |
2.3 系统总览 | 第32-34页 |
2.3.1 混合式查询形式 | 第32-33页 |
2.3.2 系统组件 | 第33-34页 |
2.4 Semplore核心功能 | 第34-39页 |
2.4.1 数据索引 | 第34-36页 |
2.4.2 搜索功能 | 第36-39页 |
2.5 Semplore扩展 | 第39-46页 |
2.5.1 基于关系的排序 | 第39-41页 |
2.5.2 分面搜索和浏览 | 第41-42页 |
2.5.3 索引更新 | 第42-46页 |
2.6 实验评估和讨论 | 第46-51页 |
2.6.1 索引建立和更新 | 第46-47页 |
2.6.2 结构化查询能力 | 第47-49页 |
2.6.3 混合式搜索 | 第49-51页 |
2.7 相关工作 | 第51-53页 |
2.8 本章小结 | 第53-54页 |
第三章 面向RDF数据的高效SPARQL查询处理 | 第54-74页 |
3.1 引言 | 第54页 |
3.2 概述 | 第54-56页 |
3.3 问题描述 | 第56-58页 |
3.4 索引结构和操作子 | 第58-62页 |
3.4.1 索引结构 | 第58-59页 |
3.4.2 操作子 | 第59-61页 |
3.4.3 SPARQL查询图和操作子的关系 | 第61-62页 |
3.5 查询优化 | 第62-66页 |
3.5.1 代价模型 | 第63-64页 |
3.5.2 优化算法 | 第64-66页 |
3.6 性能研究 | 第66-72页 |
3.6.1 数据加载与索引时间 | 第67-69页 |
3.6.2 代价估计准确性 | 第69-70页 |
3.6.3 查询时间 | 第70-72页 |
3.7 相关工作 | 第72-73页 |
3.8 本章小结 | 第73-74页 |
第四章 面向RDF数据的基于模式的高效查询处理 | 第74-94页 |
4.1 引言 | 第74页 |
4.2 概述 | 第74-76页 |
4.3 问题定义 | 第76-79页 |
4.3.1 数据图 | 第76-77页 |
4.3.2 SPARQL和基本图模式 | 第77-78页 |
4.3.3 答案和绑定 | 第78-79页 |
4.4 模式索引 | 第79-82页 |
4.4.1 哈希模式 | 第79-80页 |
4.4.2 索引和存储结构 | 第80-81页 |
4.4.3 模式编码 | 第81-82页 |
4.5 查询执行 | 第82-86页 |
4.5.1 模式树 | 第83-84页 |
4.5.2 查询计划 | 第84-86页 |
4.6 模式选择 | 第86-89页 |
4.6.1 基于启发式规则的模式选择 | 第86-87页 |
4.6.2 频繁查询模式挖掘 | 第87-89页 |
4.7 实验评测 | 第89-92页 |
4.7.1 基于模式的方式与基于三元组的方法的比较 | 第89-90页 |
4.7.2 启发式模式与频繁模式的比较 | 第90-91页 |
4.7.3 可扩展性 | 第91页 |
4.7.4 空间-时间的权衡取舍 | 第91-92页 |
4.8 相关工作 | 第92-93页 |
4.9 本章总结 | 第93-94页 |
第五章 面向数据万维网的大规模实体匹配 | 第94-114页 |
5.1 引言 | 第94页 |
5.2 概述 | 第94-97页 |
5.3 解决方案概述 | 第97页 |
5.4 特征选取 | 第97-99页 |
5.5 分块 | 第99-101页 |
5.6 聚类 | 第101-104页 |
5.7 实验评估 | 第104-112页 |
5.7.1 实验搭建 | 第104页 |
5.7.2 实体匹配效果评测方案 | 第104-105页 |
5.7.3 分块评测 | 第105-108页 |
5.7.4 聚类评估 | 第108-110页 |
5.7.5 进一步观察 | 第110-112页 |
5.8 相关工作 | 第112-113页 |
5.9 本章小结 | 第113-114页 |
第六章 在大规模RDF图数据上的高效关键词查询 | 第114-138页 |
6.1 引言 | 第114页 |
6.2 概述 | 第114-116页 |
6.3 问题定义 | 第116-119页 |
6.4 方法综述 | 第119-121页 |
6.5 索引图数据 | 第121-123页 |
6.5.1 关键词索引 | 第121-122页 |
6.5.2 图模式索引 | 第122-123页 |
6.6 评分 | 第123-125页 |
6.7 查询翻译 | 第125-131页 |
6.7.1 图搜索算法 | 第125-126页 |
6.7.2 搜索最小匹配子图 | 第126-128页 |
6.7.3 前k子图计算 | 第128-130页 |
6.7.4 查询映射 | 第130-131页 |
6.8 实验评估 | 第131-135页 |
6.8.1 有效性研究 | 第132-133页 |
6.8.2 可用性评测 | 第133-134页 |
6.8.3 性能评估 | 第134-135页 |
6.9 相关工作 | 第135-136页 |
6.10 本章小结 | 第136-138页 |
第七章 Hermes:按需支付整合的数据万维网搜索 | 第138-168页 |
7.1 引言 | 第138页 |
7.2 概述 | 第138-140页 |
7.3 Hermes架构 | 第140-146页 |
7.3.1 数据模型 | 第141-143页 |
7.3.2 查询模型 | 第143-144页 |
7.3.3 概念架构 | 第144-146页 |
7.4 数据预处理 | 第146-150页 |
7.4.1 关键词索引的构建 | 第146-147页 |
7.4.2 结构索引的构建 | 第147-148页 |
7.4.3 映射索引的构建 | 第148-149页 |
7.4.4 图元素的评分 | 第149-150页 |
7.5 关键词查询翻译 | 第150-156页 |
7.5.1 查询搜索空间的创建 | 第151-152页 |
7.5.2 探索最优k查询图 | 第152-154页 |
7.5.3 查询图评分 | 第154-156页 |
7.6 分布式查询处理 | 第156-159页 |
7.6.1 查询图分解 | 第156页 |
7.6.2 查询计划 | 第156-157页 |
7.6.3 查询图映射 | 第157-158页 |
7.6.4 查询结果合并 | 第158-159页 |
7.7 实验评估 | 第159-165页 |
7.7.1 实验设置 | 第159-161页 |
7.7.2 数据预处理 | 第161页 |
7.7.3 关键词翻译 | 第161-163页 |
7.7.4 分布式查询处理 | 第163-165页 |
7.8 相关工作 | 第165-166页 |
7.9 本章小结 | 第166-168页 |
第八章 基于IR和DB整合的混合搜索 | 第168-196页 |
8.1 引言 | 第168页 |
8.2 概述 | 第168-170页 |
8.3 混合搜索 | 第170-178页 |
8.3.1 资源 | 第170-171页 |
8.3.2 查询 | 第171-173页 |
8.3.3 答案 | 第173-174页 |
8.3.4 排序 | 第174-178页 |
8.4 CE~2架构 | 第178页 |
8.5 数据存储和索引 | 第178-182页 |
8.5.1 数据表模式 | 第179页 |
8.5.2 数据库索引 | 第179-180页 |
8.5.3 倒排索引 | 第180-181页 |
8.5.4 字典编码 | 第181-182页 |
8.6 查询回答过程 | 第182-188页 |
8.6.1 查询分解 | 第182页 |
8.6.2 原子查询执行 | 第182-184页 |
8.6.3 查询结果合并 | 第184-186页 |
8.6.4 排序投影 | 第186-187页 |
8.6.5 迭代排序计算 | 第187-188页 |
8.7 实验 | 第188-193页 |
8.7.1 有效性研究 | 第189-191页 |
8.7.2 标注管理的效率 | 第191-192页 |
8.7.3 排序效率 | 第192-193页 |
8.8 相关工作 | 第193-195页 |
8.9 本章小结 | 第195-196页 |
第九章 总结与展望 | 第196-198页 |
9.1 研究工作的总结 | 第196-197页 |
9.2 进一步研究的展望 | 第197-198页 |
参考文献 | 第198-212页 |
攻读博士学位期间撰写的学术论文 | 第212-218页 |
致谢 | 第218-221页 |