Spark Streaming参数—资源协同配置关键技术研究

摘要	第4-5页
Abstract	第5-6页
第1章绪论	第10-16页
1.1 课题背景和研究意义	第10-12页
1.1.1 大数据流式计算	第10-11页
1.1.2 批量流式计算平台典型代表SparkStreaming	第11页
1.1.3 云环境下的SparkStreaming	第11-12页
1.1.4 SparkStreaming中参数配置和资源分配的研究意义	第12页
1.2 国内外研究现状与不足	第12-13页
1.3 参数配置和资源分配的协同优化技术面临的挑战	第13-14页
1.4 本文主要贡献	第14-15页
1.5 本文的组织结构	第15-16页
第2章相关工作	第16-24页
2.1 大数据流式计算平台的发展	第16-17页
2.2 批量流式计算平台概述	第17-19页
2.2.1 批量流式计算平台的特征	第17页
2.2.2 SparkStreaming概述	第17-19页
2.3 云环境下流式计算平台中相关优化技术	第19-22页
2.3.1 云环境下批量流式计算平台中相关优化技术	第19-20页
2.3.2 云环境下连续流式计算平台中相关优化技术	第20-21页
2.3.3 云环境下批量计算平台中的相关优化技术	第21-22页
2.4 大数据领域性能建模相关工作	第22-23页
2.5 本章小结	第23-24页
第3章总体设计	第24-28页
3.1 参数配置和资源分配协同优化方法的可行性分析	第24-25页
3.2 参数配置和资源分配协同优化方法的总体设计	第25-27页
3.2.1 模型构建	第26页
3.2.2 优化方案选取	第26-27页
3.3 本章小结	第27-28页
第4章基于张量的性能模型构建方法	第28-38页
4.1 性能建模的关键问题	第28-29页
4.2 张量介绍	第29-32页
4.2.1 张量的定义与基本运算	第29-30页
4.2.2 张量分解	第30页
4.2.3 Tucker分解的求解方法	第30-32页
4.3 性能模型的构建	第32-36页
4.3.1 影响性能关键因素的选取	第32页
4.3.2 基于张量的问题模型构建	第32-34页
4.3.3 基于张量补全的性能模型构建算法	第34-36页
4.4 基于时间戳的样本数据丢弃方法	第36-37页
4.5 本章小结	第37-38页
第5章参数配置和资源分配协同优化方案选取策略	第38-48页
5.1 问题定义	第38-39页
5.2 问题建模	第39-46页
5.2.1 动态邻域粒子群算法介绍	第39-40页
5.2.2 基于动态邻域粒子群算法的问题建模	第40-44页
5.2.3 基于动态邻域粒子群的参数配置和资源分配优化方案选取算法	第44-46页
5.3 在线匹配策略	第46页
5.4 本章小结	第46-48页
第6章原型系统实现及性能评估	第48-68页
6.1 参数配置和资源分配协同优化方法的实现	第48-52页
6.1.1 APAR系统架构	第48-49页
6.1.2 数据结构	第49-51页
6.1.3 原型系统APAR工作流程	第51-52页
6.2 实验方法概述	第52-55页
6.2.1 测试负载	第52-54页
6.2.2 测试环境	第54页
6.2.3 性能评价指标	第54-55页
6.3 实验设计与结果分析	第55-67页
6.3.1 系统总体性能	第55-64页
6.3.2 模型评估	第64-66页
6.3.3 系统收敛速度测试结果与分析	第66-67页
6.4 本章小结	第67-68页
结论	第68-70页
参考文献	第70-76页
攻读硕士期间发表的学术论文	第76-78页
致谢	第78页