摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
1 绪论 | 第10-18页 |
1.1 研究背景及研究意义 | 第10-11页 |
1.2 所做工作及创新点 | 第11-12页 |
1.3 国内外研究现状 | 第12-17页 |
1.3.1 Hadoop数据处理框架 | 第12-13页 |
1.3.2 Spark数据处理框架 | 第13-14页 |
1.3.3 Disco数据处理框架 | 第14-15页 |
1.3.4 MARS数据处理框架 | 第15页 |
1.3.5 四种框架的优缺点对比分析 | 第15-17页 |
1.4 本文章节安排 | 第17页 |
1.5 本章小结 | 第17-18页 |
2 背景技术 | 第18-26页 |
2.1 GPU | 第18-21页 |
2.1.1 GPU简介 | 第18页 |
2.1.2 GPU核心架构 | 第18-20页 |
2.1.3 GPU线程 | 第20-21页 |
2.2 CUDA | 第21-23页 |
2.2.1 CUDA简介 | 第21页 |
2.2.2 CUDA执行模型 | 第21-22页 |
2.2.3 CUDA C语言 | 第22-23页 |
2.3 MAPREDUCE | 第23-25页 |
2.3.1 MAPREDUCE简介 | 第23页 |
2.3.2 MAPREDUCE工作流程 | 第23-24页 |
2.3.3 MAPREDUCE Shuffle处理 | 第24-25页 |
2.4 本章小结 | 第25-26页 |
3 MARS整体框架介绍 | 第26-34页 |
3.1 MARS框架简介 | 第26页 |
3.2 MARS框架实现目标 | 第26-27页 |
3.3 MARS框架工作流程 | 第27-28页 |
3.4 MARS框架参数配置 | 第28页 |
3.5 MARS框架内存分配 | 第28-29页 |
3.6 MARS框架接口设计 | 第29-31页 |
3.7 MARS框架关键技术 | 第31-32页 |
3.7.1 线程并行化 | 第31页 |
3.7.2 合并访问 | 第31页 |
3.7.3 使用内置向量进行访问 | 第31-32页 |
3.7.4 处理大小可变的数据 | 第32页 |
3.7.5 排序 | 第32页 |
3.7.6 文件处理 | 第32页 |
3.8 本章小结 | 第32-34页 |
4 MARS框架的实现 | 第34-44页 |
4.1 整体框架结构 | 第34-35页 |
4.2 MARS框架功能模块 | 第35-42页 |
4.2.1 预处理模块 | 第35-37页 |
4.2.2 排序模块 | 第37-39页 |
4.2.3 GPU运算模块 | 第39-41页 |
4.2.4 自定义模块 | 第41-42页 |
4.3 MARS框架数据流图 | 第42-43页 |
4.4 MARS框架总体流程图 | 第43-44页 |
5 MARS框架应用及结果展示 | 第44-50页 |
5.1 MARS框架应用案例 | 第44-45页 |
5.2 实验部署及结果展示 | 第45-50页 |
5.2.1 实验部署 | 第45-46页 |
5.2.2 实验结果展示 | 第46-50页 |
6 总结与展望 | 第50-52页 |
参考文献 | 第52-54页 |
致谢 | 第54-56页 |
攻读学位期间参与的科研项目 | 第56-57页 |