摘要 | 第4-5页 |
abstract | 第5-6页 |
第1章 绪论 | 第9-19页 |
1.1 研究背景以及意义 | 第9-11页 |
1.2 国内外研究现状 | 第11-16页 |
1.2.1 任务调度研究现状 | 第11-15页 |
1.2.2 数据倾斜研究现状 | 第15-16页 |
1.3 论文的主要研究工作 | 第16-17页 |
1.4 论文的结构安排 | 第17-19页 |
第2章 Reduce任务调度优化研究 | 第19-39页 |
2.1 Hadoop资源管理方案 | 第19-20页 |
2.2 Hadoop的调度策略 | 第20-21页 |
2.3 一种Reduce任务数据本地性感知的多级均衡延时调度策略 | 第21-32页 |
2.3.1 基于朴素贝叶斯的节点负载模型 | 第21-23页 |
2.3.2 基于网络拓扑结构的Reduce任务本地性模型 | 第23-29页 |
2.3.3 一种本地性感知的多级均衡延时调度策略 | 第29-32页 |
2.4 本地性感知的多级均衡延时调度策略MLBDS的实现 | 第32-37页 |
2.5 本章小结 | 第37-39页 |
第3章 数据倾斜优化研究 | 第39-58页 |
3.1 Hadoop中的数据倾斜问题 | 第39-40页 |
3.2 基于抽样的增量多队列分区策略 | 第40-50页 |
3.2.1 Hadoop抽样器 | 第40-41页 |
3.2.2 增量多队列分区策略 | 第41-49页 |
3.2.3 基于抽样的增量多队列分区策略 | 第49-50页 |
3.3 数据倾斜优化策略的实现 | 第50-57页 |
3.4 本章小结 | 第57-58页 |
第4章 性能测试与分析 | 第58-71页 |
4.1 实验环境与配置 | 第58-61页 |
4.1.1 Hadoop集群的软硬件配置 | 第58-59页 |
4.1.2 实验数据 | 第59-60页 |
4.1.3 实验设计 | 第60-61页 |
4.2 实验结果及分析 | 第61-70页 |
4.2.1 实验的实施 | 第61-63页 |
4.2.2 实验结果及分析 | 第63-70页 |
4.3 本章小结 | 第70-71页 |
第5章 总结与展望 | 第71-73页 |
5.1 总结 | 第71页 |
5.2 展望 | 第71-73页 |
致谢 | 第73-74页 |
参考文献 | 第74-79页 |
在读期间发表的学术论文与取得的其他研究成果 | 第79页 |