基于计算重用的Spark执行规划优化技术的研究与实现

摘要	第9-10页
ABSTRACT	第10页
第一章绪论	第11-19页
1.1 研究背景	第11-12页
1.2 国内外研究现状	第12-16页
1.2.1 传统数据库中的计算重用技术	第12页
1.2.2 NoSQL数据库中基于重用的优化技术	第12-16页
1.3 研究目的和意义	第16页
1.4 论文主要工作	第16-19页
第二章相关技术研究现状分析	第19-45页
2.1 Spark概述	第19-24页
2.1.1 Spark生态系统	第20-23页
2.1.2 Spark架构及基本组件	第23-24页
2.2 Spark执行规划	第24-35页
2.2.1 SparkRDD简介	第24-26页
2.2.2 SparkRDD操作算子	第26-31页
2.2.3 Spark应用的执行规划	第31-35页
2.2.4 Spark应用的语义描述	第35页
2.3 Spark重用机制	第35-39页
2.3.1 Spark中基于缓存的重用技术	第36-38页
2.3.2 基于共享变量的重用技术	第38-39页
2.3.3 应用内的Spark重用	第39页
2.4 语义缓存技术	第39-42页
2.4.1 语义缓存存储形式	第39-40页
2.4.2 查询匹配以及查询划分	第40-41页
2.4.3 缓存替换算法	第41页
2.4.4 缓存的一致性维护	第41-42页
2.5 面向MapReduce系统的数据处理优化技术	第42-44页
2.5.1 基于混合架构的MapReduce计算优化技术	第42-43页
2.5.2 基于重用的MapReduce作业流优化技术	第43-44页
2.6 小结	第44-45页
第三章基于计算重用的Spark执行规划优化模型	第45-65页
3.1 基于语义DAG图的计算重用发现技术研究	第45-54页
3.1.1 语义DAG图与二叉树的转换技术	第46-48页
3.1.2 二叉树的深度优先遍历算法	第48-50页
3.1.3 基于深度优先遍历的语义二叉树匹配算法	第50-53页
3.1.4 计算重用的发现算法	第53-54页
3.2 基于计算代价增益率的Spark缓存仓库丰富策略	第54-57页
3.2.1 计算代价增益率计算模型	第55-56页
3.2.2 计算代价增益率的计算	第56-57页
3.3 Spark执行规划优化策略	第57-58页
3.4 实验分析	第58-63页
3.4.1 实验环境	第59页
3.4.2 实验数据集	第59-60页
3.4.3 优化模型效果分析	第60-63页
3.5 小结	第63-65页
第四章 Spark重用优化系统的设计与实现	第65-73页
4.1 系统功能设计	第65-66页
4.2 系统架构与技术选型	第66-68页
4.2.1 系统架构	第66页
4.2.2 语义数据存储技术选型	第66-67页
4.2.3 缓存结果存储技术选型	第67-68页
4.3 系统实现	第68-72页
4.3.1 重用子系统实现	第68-70页
4.3.2 缓存管理子系统实现	第70-72页
4.4 小结	第72-73页
第五章总结与展望	第73-75页
5.1 本文工作总结	第73-74页
5.2 研究工作展望	第74-75页
致谢	第75-77页
参考文献	第77-81页
作者在学期间取得的学术成果	第81页