SPARK SQL系统查询优化的研究与实现

摘要	第4-5页
ABSTRACT	第5-6页
第一章绪论	第9-12页
1.1 研究背景	第9-10页
1.2 研究现状	第10页
1.3 论文内容	第10-12页
第二章相关技术	第12-27页
2.1 SQL-on-Hadoop系统	第12-16页
2.1.1 Hadoop生态系统简介	第12-14页
2.1.2 SQL-on-Hadoop系统概述	第14-16页
2.2 Spark及Spark SQL介绍	第16-20页
2.2.1 Spark背景介绍	第16-19页
2.2.2 Spark SQL介绍	第19-20页
2.3 列式存储结构Parquet	第20-23页
2.3.1 列式存储与行式存储的比较	第20-21页
2.3.2 列式存储结构Parquet	第21-22页
2.3.3 Parquet的局限性	第22-23页
2.4 布隆过滤器和直方图	第23-25页
2.4.1 布隆过滤器(Bloom Filter)简介	第23-24页
2.4.2 直方图(Histogram)简介	第24-25页
2.4.3 布隆过滤器与直方图的应用	第25页
2.5 本章小结	第25-27页
第三章 Spark SQL系统查询优化研究分析	第27-36页
3.1 研究概况及缺陷	第27-29页
3.2 优化方案研究与设计	第29-35页
3.2.1 数据准备阶段的优化	第29-32页
3.2.2 数据源加载阶段的优化	第32-34页
3.2.3 查询执行阶段的优化	第34-35页
3.3 本章小结	第35-36页
第四章 Spark SQL系统查询优化详细设计	第36-53页
4.1 Spark SQL系统查询优化整体架构	第36-37页
4.2 数据重写	第37-38页
4.3 元数据生成	第38-47页
4.3.1 布隆过滤器	第38-44页
4.3.2 直方图	第44-47页
4.4 谓词下推	第47-51页
4.4.1 Spark SQL执行流程	第47-48页
4.4.2 具体实现	第48-51页
4.5 Spark SQL查询执行	第51-52页
4.6 本章小结	第52-53页
第五章 Spark SQL系统查询优化的测试与分析	第53-61页
5.1 测试环境与实验设置	第53-54页
5.2 基准测试与分析	第54-55页
5.3 布隆过滤器	第55-57页
5.4 直方图	第57-59页
5.5 针对LIMIT语句的优化	第59页
5.6 最终优化结果	第59-60页
5.7 本章小结	第60-61页
第六章结束语	第61-63页
6.1 论文工作总结	第61-62页
6.2 未来工作展望	第62-63页
参考文献	第63-65页
致谢	第65-66页
攻读硕士学位期间发表的学术论文目录	第66页