基于超图和浓密树的大数据实时查询优化研究与实现

摘要	第4-5页
Abstract	第5页
第1章绪论	第11-21页
1.1 研究背景及意义	第11-13页
1.2 相关研究工作	第13-19页
1.2.1 搜索空间	第13-14页
1.2.2 搜索策略	第14-16页
1.2.3 代价模型	第16-18页
1.2.4 目前研究存在的问题	第18-19页
1.3 研究目标及内容	第19页
1.4 本文结构组织	第19-20页
1.5 本章小结	第20-21页
第2章 Impala大数据实时查询系统	第21-26页
2.1 Impala介绍	第21-22页
2.1.1 Impala 1.0系统	第21-22页
2.1.2 Impala 2.0系统	第22页
2.2 Impala 1.0系统查询过程	第22-24页
2.2.1 语法解析	第22-23页
2.2.2 查询计划生成	第23-24页
2.2.3 执行计划生成	第24页
2.2.4 查询和汇总	第24页
2.3 Impala 2.0系统对查询过程的改进	第24-25页
2.4 本章小结	第25-26页
第3章代价估计	第26-33页
3.1 概述	第26页
3.2 统计信息收集	第26-29页
3.3 代价模型	第29-30页
3.4 代价估计方法	第30-31页
3.4.1 基于表的代价估计方法	第30-31页
3.4.2 基于列的代价估计方法	第31页
3.5 本章小结	第31-33页
第4章基于超图和浓密树的大数据实时查询优化	第33-48页
4.1 概述	第33页
4.2 基本定义	第33-34页
4.3 查询超图建模	第34页
4.4 改进的McCHyp算法	第34-46页
4.4.1 集成剪枝策略的改进的McCHyp算法	第35-37页
4.4.2 改进的McCHyp算法优化过程举例	第37-46页
4.5 剪枝策略的完整性和正确性	第46-47页
4.6 本章小结	第47-48页
第5章系统实现	第48-59页
5.1 系统总体框架	第48-49页
5.2 查询计划形式的修改方法	第49-54页
5.2.1 JoinTree结构	第50-51页
5.2.2 JoinNode结构	第51-52页
5.2.3 HashJoinRef结构	第52-54页
5.2.4 构造查询计划的方法	第54页
5.3 改进的McCHyp算法在Impala中的集成	第54-58页
5.4 本章小结	第58-59页
第6章实验评估	第59-70页
6.1 实验环境	第59-60页
6.2 实验设置	第60页
6.3 实验数据	第60-61页
6.4 实验结果与分析	第61-69页
6.4.1 优化算法对比	第61-63页
6.4.2 代价模型对比	第63-64页
6.4.3 查询性能对比	第64-67页
6.4.4 可扩展性对比	第67-69页
6.5 本章小结	第69-70页
第7章总结与展望	第70-72页
7.1 总结	第70-71页
7.2 展望	第71-72页
参考文献	第72-76页
攻读硕士学位期间主要的研究成果	第76-77页
致谢	第77-78页