分布式环境下计算结果重用的研究与实现

摘要	第4-6页
ABSTRACT	第6-7页
第1章绪论	第10-15页
1.1 引言	第10-11页
1.2 研究现状	第11-13页
1.3 研究内容与贡献	第13-14页
1.4 文章结构	第14-15页
第2章基础理论	第15-27页
2.1 HDFS	第15-19页
2.1.1 Datanode 与 Namenode	第15-16页
2.1.2 元数据	第16-17页
2.1.3 数据组织	第17-18页
2.1.4 数据维护	第18-19页
2.2 MapReduce 执行流程	第19-22页
2.2.1. Hadoop 中的 MapReduce 工作流程	第20-21页
2.2.2. Hadoop 中 MapReduce 的任务调度	第21-22页
2.3 Hive 介绍	第22-26页
2.3.1 Hive 是什么	第22-23页
2.3.2 Hive 的优势	第23-24页
2.3.3 HiveQL 介绍	第24-26页
2.4 本章小结	第26-27页
第3章分析及框架	第27-33页
3.1 Hive 生成抽象语法树及依赖关系	第27-30页
3.2 Hive 连接示例	第30页
3.3 可重用性分析	第30-32页
3.4 本章小结	第32-33页
第4章策略实现	第33-45页
4.1 基本策略	第33-40页
4.1.1 生成连接体	第33-35页
4.1.2 查找可重用的计算结果	第35-40页
4.2 复杂度分析	第40页
4.3 提高重用概率	第40-42页
4.3.1 多键选择	第41页
4.3.2 延迟算数运算	第41页
4.3.3 语义理解	第41-42页
4.4 计算结果的管理	第42-44页
4.5 本章小结	第44-45页
第5章有效性分析	第45-57页
5.1 实验环境	第45页
5.1.1 硬件环境	第45页
5.1.2 软件环境	第45页
5.2 数据集	第45-48页
5.2.1 TPC-H Benchmark	第45-46页
5.2.2 SSB Benchmark	第46-48页
5.3 实验结果与评价	第48-56页
5.3.1 TPC-H 单连接体重用	第48-52页
5.3.2 TPC-H 多连接体重用	第52-53页
5.3.3 SSB 查询时间	第53-54页
5.3.4 初次查询时间开销对比	第54-56页
5.4 本章小结	第56-57页
第6章总结与展望	第57-59页
6.1 总结	第57-58页
6.2 展望	第58-59页
参考文献	第59-64页
攻读学位期间的研究成果目录	第64-65页
致谢	第65页