摘要 | 第4-5页 |
Abstract | 第5-6页 |
第1章 绪论 | 第9-15页 |
1.1 研究背景 | 第9-11页 |
1.1.1 流式数据特征和流式计算的发展背景 | 第9-10页 |
1.1.2 Spark Streaming系统 | 第10-11页 |
1.2 国内外研究现状与不足 | 第11-13页 |
1.2.1 数据划分策略的现状与不足 | 第11-12页 |
1.2.2 数据放置策略的现状与不足 | 第12-13页 |
1.3 本文主要贡献 | 第13-14页 |
1.4 本文组织结构 | 第14页 |
1.5 本章小结 | 第14-15页 |
第2章 相关工作 | 第15-23页 |
2.1 大数据流式计算平台的演进 | 第15-16页 |
2.1.1 大数据流式计算的特征 | 第15页 |
2.1.2 大数据流式计算平台的发展历程 | 第15-16页 |
2.2 Spark Streaming平台概述 | 第16-19页 |
2.2.1 批量流式计算系统的新特征 | 第16-17页 |
2.2.2 Spark Streaming平台概述 | 第17-19页 |
2.3 数据划分相关技术研究 | 第19-20页 |
2.3.1 批量流式计算领域数据划分相关技术研究 | 第19页 |
2.3.2 其它大数据系统相关研究 | 第19-20页 |
2.4 数据放置相关技术研究 | 第20-22页 |
2.4.1 批量流式计算领域数据放置策略相关研究 | 第20页 |
2.4.2 其它大数据领域数据放置策略相关研究 | 第20-22页 |
2.5 本章小结 | 第22-23页 |
第3章 Spark Streaming平台动态数据划分策略 | 第23-37页 |
3.1 问题描述 | 第23-24页 |
3.2 动态数据划分策略的设计 | 第24-28页 |
3.2.1 动态数据划分策略的基本思路 | 第24-26页 |
3.2.2 基于近似一维搜索法的数据动态划分策略 | 第26-28页 |
3.3 动态数据划分策略的实现 | 第28-29页 |
3.4 性能测试与分析 | 第29-35页 |
3.4.1 测试负载 | 第30-31页 |
3.4.2 测试指标 | 第31页 |
3.4.3 性能测试与分析 | 第31-35页 |
3.4.4 本节小结 | 第35页 |
3.5 本章小结 | 第35-37页 |
第4章 Spark Streaming平台动态加权数据放置策略 | 第37-53页 |
4.1 问题描述 | 第37-39页 |
4.2 动态加权数据放置策略的设计 | 第39-45页 |
4.2.1 动态加权数据放置策略的基本思路 | 第39-40页 |
4.2.2 动态加权数据放置策略的总体流程 | 第40-41页 |
4.2.3 节点数据放置权重计算模型 | 第41-44页 |
4.2.4 动态加权数据放置策略 | 第44-45页 |
4.3 动态加权数据放置策略的实现 | 第45-46页 |
4.4 性能测试与分析 | 第46-52页 |
4.4.1 测试负载 | 第47页 |
4.4.2 测试指标 | 第47页 |
4.4.3 测试思路 | 第47-48页 |
4.4.4 测试结果与分析 | 第48-52页 |
4.4.5 本节小结 | 第52页 |
4.5 本章小结 | 第52-53页 |
结论 | 第53-55页 |
参考文献 | 第55-59页 |
攻读硕士学位期间所发表的学术论文 | 第59-61页 |
致谢 | 第61页 |