基于Spark框架的动态自适应数据表关联应用技术研究

摘要	第5-6页
Abstract	第6-7页
第1章绪论	第12-17页
1.1 研究背景及意义	第12-13页
1.2 国内外研究现状	第13-15页
1.3 论文的主要内容	第15页
1.4 论文的组织结构	第15-17页
第2章相关技术研究	第17-31页
2.1 Spark分布式计算框架	第17-25页
2.1.1 Spark简介	第17-20页
2.1.2 Spark的数据存储	第20-22页
2.1.3 Spark执行原理	第22-23页
2.1.4 Spark与Hadoop MapReduce	第23-25页
2.2 MapReduce框架下的数据连接技术	第25-28页
2.2.1 重分区连接(Repartition join)	第26-27页
2.2.2 复制连接(Replication join)	第27页
2.2.3 半连接(Semi-join)	第27-28页
2.3 多表连接	第28-30页
2.3.1 链式连接技术	第28-29页
2.3.2 星型连接技术	第29-30页
2.4 本章小结	第30-31页
第3章动态自适应数据表关联应用技术框架	第31-46页
3.1 基本假设	第32-33页
3.2 数据处理框架	第33-35页
3.3 数据关联与存储体系	第35-43页
3.3.1 数据表关联分析	第36-39页
3.3.2 数据表存储策略	第39-40页
3.3.3 数据并行关联查询	第40-42页
3.3.4 基于Spark的三级存储框架S-TLSF	第42-43页
3.4 动态自适应模式	第43-44页
3.5 关联查询操作	第44-45页
3.6 本章小结	第45-46页
第4章实验结果及分析	第46-51页
4.1 实验环境设置	第46-47页
4.2 实验目的和方法	第47-48页
4.3 实验结果及分析	第48-50页
4.3.1 不同计算框架对关联查询效率的影响	第48页
4.3.2 数据关联合并前后的查询效率对比分析	第48-49页
4.3.3 动态数据环境下数据更新效率分析	第49-50页
4.4 本章小结	第50-51页
第5章总结与展望	第51-53页
论文完成的主要工作	第51页
未来工作展望	第51-53页
参考文献	第53-57页
附录: 攻读硕士学位期间的科研情况	第57-58页
致谢	第58页