PyGel:基于DPark的分布式图计算引擎的研究与实现
摘要 | 第5-6页 |
Abstract | 第6页 |
目录 | 第7-9页 |
第一章 绪论 | 第9-13页 |
1.1 课题的背景和现状 | 第9-10页 |
1.2 课题选择原因 | 第10-11页 |
1.3 主要工作和组织结构 | 第11-12页 |
1.4 本章小结 | 第12-13页 |
第二章 DPark(Spark)的研究概述 | 第13-34页 |
2.1 传统 MapReduce 模型 | 第13-14页 |
2.2 DPark 与 Spark 概述 | 第14-20页 |
2.2.1 Spark 的概述 | 第14-16页 |
2.2.2 DPark 的概述 | 第16-19页 |
2.2.3 DPark 与 Spark 的区别 | 第19-20页 |
2.3 核心概念 RDD | 第20-27页 |
2.3.1 RDD 简述 | 第20-21页 |
2.3.2 RDD 的容错机制 | 第21-22页 |
2.3.3 RDD 内部的设计 | 第22-23页 |
2.3.4 RDD 的两种动作 | 第23-27页 |
2.4 两种共享变量 | 第27-29页 |
2.4.1 广播变量 | 第27-28页 |
2.4.2 累加器 | 第28-29页 |
2.5 DPark 的任务调度机制 | 第29-30页 |
2.6 资源调度组件 Mesos | 第30-33页 |
2.7 分布式文件系统 MooseFS | 第33页 |
2.8 本章小结 | 第33-34页 |
第三章 Pregel 的研究概述 | 第34-40页 |
3.1 BSP 模型 | 第34-35页 |
3.2 Pregel 模型 | 第35-39页 |
3.2.1 Pregel 简介 | 第35-36页 |
3.2.2 Pregel 的实现 | 第36-38页 |
3.2.3 Pregel 的不足 | 第38-39页 |
3.3 本章小结 | 第39-40页 |
第四章 Pregel 模型在 DPark 的实现 | 第40-50页 |
4.1 实体的实现 | 第40-41页 |
4.2 计算子的实现 | 第41-44页 |
4.2.1 Compute 实现 | 第41-42页 |
4.2.2 Combiner 实现 | 第42-43页 |
4.2.3 Aggregator 实现 | 第43-44页 |
4.3 输入输出的实现 | 第44页 |
4.4 计算流程的实现 | 第44-48页 |
4.5 实现不足之处 | 第48页 |
4.6 本章小结 | 第48-50页 |
第五章 实验与结果分析 | 第50-57页 |
5.1 前置工作 | 第50页 |
5.2 实验概况 | 第50-55页 |
5.3 结果分析 | 第55-56页 |
5.4 本章小结 | 第56-57页 |
第六章 总结与展望 | 第57-59页 |
6.1 工作总结 | 第57页 |
6.2 课题展望 | 第57-59页 |
参考文献 | 第59-61页 |
致谢 | 第61-62页 |
附件 | 第62页 |