面向云平台优化的数据支撑工具研究与实现
摘要 | 第4-5页 |
ABSTRACT | 第5页 |
第1章 绪论 | 第8-13页 |
1.1 课题来源与背景 | 第8页 |
1.1.1 课题来源 | 第8页 |
1.1.2 课题背景 | 第8页 |
1.2 国内外研究现状 | 第8-11页 |
1.2.1 云平台的发展 | 第8-10页 |
1.2.2 云平台优化的研究现状 | 第10-11页 |
1.3 本文的主要研究内容 | 第11-12页 |
1.4 本文结构 | 第12-13页 |
第2章 云平台相关知识 | 第13-18页 |
2.1 云平台简介 | 第13页 |
2.2 Hadoop分布式系统 | 第13-15页 |
2.2.1 Hadoop异构环境 | 第13-14页 |
2.2.2 MapReduce编程模型 | 第14-15页 |
2.2.3 分布式文件管理系统 | 第15页 |
2.3 Spark相关知识 | 第15-16页 |
2.4 云平台的优化 | 第16-17页 |
2.5 本章小结 | 第17-18页 |
第3章 面向Hadoop优化的数据支撑工具 | 第18-33页 |
3.1 引言 | 第18页 |
3.2 数据分布对异构Hadoop环境的影响 | 第18-23页 |
3.2.1 数据放置策略 | 第18-21页 |
3.2.2 DPS算法的应用与实验分析 | 第21-23页 |
3.3 Hadoop+设计与实现 | 第23-25页 |
3.3.1 Hadoop默认分布策略 | 第23-24页 |
3.3.2 Hadoop数据放置策略的功能扩展 | 第24-25页 |
3.4 Hadoop+相关联数据的放置策略 | 第25-27页 |
3.5 Hadoop+与相关联的数据操作 | 第27-32页 |
3.5.1 原Hadoop日志处理 | 第28页 |
3.5.2 Hadoop+对日志处理的改进 | 第28-31页 |
3.5.3 实验和分析 | 第31-32页 |
3.6 本章小结 | 第32-33页 |
第4章 面向Spark优化的数据支撑工具 | 第33-59页 |
4.1 引言 | 第33页 |
4.2 Spark参数化调优的基础 | 第33-36页 |
4.2.1 任务运行时参数的动态设置 | 第33-34页 |
4.2.2 基于历史日志的参数化调优流程 | 第34-36页 |
4.3 基于时间预测模型的训练数据生成 | 第36-52页 |
4.3.1 时间预测模型 | 第36-37页 |
4.3.2 历史日志预处理 | 第37-39页 |
4.3.3 参数特征提取 | 第39-41页 |
4.3.4 Spark执行过程分析与参数相关性 | 第41-42页 |
4.3.5 Spark作业调度中stage | 第42-43页 |
4.3.6 时间预测模型实现 | 第43-47页 |
4.3.7 基于时间预测模型的数据支撑 | 第47-48页 |
4.3.8 实验结果与分析 | 第48-52页 |
4.4 基于任务相似性匹配的训练数据合成 | 第52-58页 |
4.4.1 任务相似性匹配流程 | 第52-53页 |
4.4.2 任务历史数据库的构建 | 第53-54页 |
4.4.3 相似性度量与特征提取 | 第54-56页 |
4.4.4 实验结果与分析 | 第56-58页 |
4.5 本章小结 | 第58-59页 |
结论 | 第59-60页 |
参考文献 | 第60-64页 |
致谢 | 第64页 |