云环境下基于MapReduce的查询优化系统研究与实现

摘要	第4-5页
ABSTRACT	第5页
第1章引言	第9-19页
1.1 研究背景	第9-11页
1.2 研究现状	第11-14页
1.2.1 云环境下的数据并行计算系统研究现状	第11-12页
1.2.2 云环境下的高级查询语言研究现状	第12-13页
1.2.3 云环境下查询优化技术的研究现状	第13-14页
1.2.4 研究现状总结	第14页
1.3 论文研究目标与意义	第14-15页
1.4 论文研究内容	第15-16页
1.5 论文的创新点与难点	第16-17页
1.5.1 论文创新点	第16页
1.5.2 论文难点	第16-17页
1.6 论文组织结构	第17-19页
第2章 MapReduce与MapReduce上层的高级查询工具介绍	第19-27页
2.1 MapReduce概述	第19-22页
2.1.1 MapReduce编程模型	第20-22页
2.2 MapReduce上层的高级查询工具概述	第22-26页
2.2.1 Hive	第22-24页
2.2.2 Pig	第24-26页
2.3 小结	第26-27页
第3章基于结果复用的查询优化机制	第27-39页
3.1 查询空间划分技术	第27-32页
3.1.1 传统的查询空间划分算法	第28页
3.1.2 基于聚类的查询空间划分算法	第28-32页
3.2 多查询结果复用关系图的构建	第32-35页
3.3 基于多查询结果复用关系图的查询处理算法	第35页
3.4 实验与分析	第35-37页
3.5 小结	第37-39页
第4章基于结构复用的执行计划优化机制	第39-49页
4.1 查询执行计划优化技术	第39-41页
4.1.1 传统的执行计划优化方法	第40-41页
4.1.2 基于最优子结构的执行计划优化方法	第41页
4.2 基于MapReduce的查询代价模型	第41-44页
4.2.1 代价模型的建立	第42-43页
4.2.2 模型参数的确定	第43-44页
4.3 基于代价模型的结构复用优化算法	第44-47页
4.3.1 基于DAG图的查询执行计划模型	第44-46页
4.3.2 基于最优子结构复用的关键路径优化算法	第46-47页
4.4 实验与分析	第47-48页
4.5 小结	第48-49页
第5章云环境下基于MapReduce的查询优化系统	第49-61页
5.1 Multi-Q系统	第49-52页
5.2 实验环境	第52-54页
5.2.1 硬件环境	第52页
5.2.2 软件环境	第52-53页
5.2.3 实验数据集	第53-54页
5.3 系统实现	第54-55页
5.4 性能对比	第55-58页
5.4.1 查询结果复用优化机制性能测试	第55-56页
5.4.2 查询结构复用优化机制性能测试	第56-57页
5.4.3 总体性能测试	第57-58页
5.5 小结	第58-61页
第6章结束语	第61-63页
6.1 论文总结	第61-62页
6.2 展望	第62-63页
参考文献	第63-67页
附录	第67-77页
附录A. Hadoop集群配置详情	第67-71页
附录B. Hive配置详情	第71-74页
附录C. TPC-H数据集的导入及测试	第74-77页
致谢	第77-79页
攻读硕士学位期间相关研究工作	第79-81页
作者简历	第81页