摘要 | 第1-4页 |
Abstract | 第4-10页 |
第一章 绪论 | 第10-16页 |
1.1 数据集成系统 | 第10-11页 |
1.2 LAV和GAV数据集成 | 第11-12页 |
1.3 LAV数据集成系统的基本结构 | 第12-13页 |
1.4 中介器 | 第13-14页 |
1.5 本文内容安排 | 第14-16页 |
第二章 全局模式和局部模式 | 第16-26页 |
2.1 相关工作 | 第16-17页 |
2.2 全局模式 | 第17-19页 |
2.3 数据源描述 | 第19-24页 |
2.3.1 描述数据源结构化接口 | 第19-21页 |
2.3.2 全局模式和数据源结构化接口之间的映射关系 | 第21-22页 |
2.3.3 查询和视图 | 第22-24页 |
2.4 进一步的工作 | 第24-25页 |
2.5 小结 | 第25-26页 |
第三章 基于数据接口的查询重写 | 第26-51页 |
3.1 相关工作 | 第26页 |
3.2 基于视图的查询重写 | 第26-39页 |
3.2.1 基本定义 | 第27-28页 |
3.2.2 数据源能够提供的数据 | 第28-33页 |
3.2.3 不考虑数据源查询能力时的查询方法 | 第33-38页 |
3.2.4 查询重写的组合 | 第38页 |
3.2.5 选择最优的查询重写 | 第38-39页 |
3.3 基于数据接口查询能力的查询方法 | 第39-49页 |
3.3.1 安排访问数据接口的顺序 | 第39-41页 |
3.3.2 基于可查询数据接口构造查询重写 | 第41-45页 |
3.3.3 放宽查询条件 | 第45-46页 |
3.3.4 任意多个视图 | 第46-47页 |
3.3.5 查询能力可变的数据接口 | 第47-48页 |
3.3.6 内置(built-in)谓词 | 第48-49页 |
3.3.7 函数依赖的作用 | 第49页 |
3.4 讨论 | 第49-50页 |
3.5 小结 | 第50-51页 |
第四章 查询优化 | 第51-73页 |
4.1 相关工作 | 第51-53页 |
4.2 传统的查询优化技术 | 第53-55页 |
4.3 优化联接顺序 | 第55-63页 |
4.3.1 以数据流量为指标的代价模型 | 第56-57页 |
4.3.2 以降低流量为目的的联接顺序 | 第57-59页 |
4.3.3 以响应时间为指标的代价模型 | 第59-60页 |
4.3.4 以缩短响应时间为目的的联接顺序 | 第60-61页 |
4.3.5 快速确定联接顺序 | 第61-63页 |
4.4 动态调整联接顺序 | 第63-65页 |
4.5 内置谓词的处理 | 第65-72页 |
4.5.1 构造对每个数据接口的查询条件 | 第66-70页 |
4.5.2 对能够接受内置谓词的数据接口的联接优化算法 | 第70-72页 |
4.6 小结 | 第72-73页 |
第五章 基于datalog的查询处理 | 第73-97页 |
5.1 相关工作 | 第73页 |
5.2 封闭世界假设与开放世界假设 | 第73-75页 |
5.3 数据接口没有查询能力约束时datalog程序的构造 | 第75-76页 |
5.4 基于查询能力受限的数据接口构造datalog程序 | 第76-89页 |
5.4.1 数据接口具有固定查询能力的情况 | 第77-84页 |
5.4.2 实验结果 | 第84页 |
5.4.3 放宽对b-谓词的约束 | 第84-85页 |
5.4.4 基于可变查询能力的数据接口的查询 | 第85-88页 |
5.4.5 查询中给定条件的表示 | 第88-89页 |
5.4.6 处理内置谓词 | 第89页 |
5.5 优化构造过程 | 第89-94页 |
5.5.1 数据接口之间关系的有向图表示 | 第89-93页 |
5.4.2 实验 | 第93-94页 |
5.6 查询重写和datalog程序两种方法的比较 | 第94-95页 |
5.7 讨论 | 第95页 |
5.8 小结 | 第95-97页 |
第六章 系统实现 | 第97-99页 |
6.1 系统基本结构 | 第97-99页 |
第七章 总结和展望 | 第99-101页 |
致谢 | 第101-102页 |
参考文献 | 第102-107页 |
附录:攻读学位期间参与的科研项目和发表的论文 | 第107-108页 |
1.参加的科研项目 | 第107页 |
2.发表的论文 | 第107-108页 |
论文独创性声明 | 第108页 |
论文使用授权声明 | 第108页 |