内存计算框架性能优化关键技术研究
摘要 | 第2-4页 |
Abstract | 第4-6页 |
第1章 绪论 | 第10-20页 |
1.1 基础概念概述 | 第10-13页 |
1.1.1 内存计算 | 第10-11页 |
1.1.2 Spark内存计算模型 | 第11-13页 |
1.2 论文研究背景 | 第13-15页 |
1.2.1 课题来源 | 第13页 |
1.2.2 Spark内存计算模型研究现状 | 第13-15页 |
1.3 论文主要研究工作 | 第15-20页 |
1.3.1 论文研究内容 | 第15-17页 |
1.3.2 主要创新点 | 第17页 |
1.3.3 论文组织结构 | 第17-20页 |
第2章 内存计算技术发展与研究现状 | 第20-30页 |
2.1 引言 | 第20-21页 |
2.2 内存计算技术概述 | 第21-22页 |
2.3 内存数据管理技术 | 第22-23页 |
2.4 内存计算框架发展现状 | 第23-24页 |
2.5 内存计算框架性能优化方法 | 第24-28页 |
2.5.1 基于资源配置的性能优化方法 | 第25-26页 |
2.5.2 基于任务调度的性能优化方法 | 第26-27页 |
2.5.3 基于故障恢复的性能优化方法 | 第27-28页 |
2.6 本章小结 | 第28-30页 |
第3章 内存计算框架自适应缓存策略研究 | 第30-51页 |
3.1 引言 | 第30-32页 |
3.2 相关工作 | 第32-33页 |
3.3 问题的建模与分析 | 第33-40页 |
3.3.1 Spark任务执行机制 | 第33-34页 |
3.3.2 内存资源模型 | 第34-35页 |
3.3.3 任务执行效率模型 | 第35-37页 |
3.3.4 RDD权重模型 | 第37-39页 |
3.3.5 自适应缓存管理策略问题定义 | 第39-40页 |
3.4 自适应缓存管理策略 | 第40-44页 |
3.4.1 缓存自动选择算法 | 第40-42页 |
3.4.2 并行缓存清理算法 | 第42-43页 |
3.4.3 权重缓存替换算法 | 第43-44页 |
3.5 实验评价与比较 | 第44-49页 |
3.5.1 实验环境 | 第44-45页 |
3.5.2 缓存自动选择算法 | 第45-46页 |
3.5.3 并行缓存清理算法 | 第46-47页 |
3.5.4 权重缓存替换算法 | 第47-48页 |
3.5.5 综合评估 | 第48-49页 |
3.6 本章小结 | 第49-51页 |
第4章 内存计算框架局部数据优先拉取策略 | 第51-77页 |
4.1 引言 | 第51-53页 |
4.2 相关研究 | 第53-55页 |
4.3 问题的建模与分析 | 第55-63页 |
4.3.1 作业执行机制 | 第55-56页 |
4.3.2 资源需求模型 | 第56-57页 |
4.3.3 执行效率模型 | 第57-58页 |
4.3.4 任务分配及调度模型 | 第58-62页 |
4.3.5 局部数据优先拉取策略问题定义 | 第62-63页 |
4.4 局部数据优先拉取策略 | 第63-70页 |
4.4.1 构建基础数据 | 第63-64页 |
4.4.2 局部数据优先拉取算法 | 第64-67页 |
4.4.3 算法的相关原则 | 第67-69页 |
4.4.4 算法开销分析 | 第69-70页 |
4.5 实验评价与比较 | 第70-75页 |
4.5.1 实验环境 | 第70-71页 |
4.5.2 作业执行效率 | 第71-72页 |
4.5.3 节点贡献度 | 第72-74页 |
4.5.4 综合评估 | 第74-75页 |
4.6 本章小结 | 第75-77页 |
第5章 内存计算框架并行度推断算法 | 第77-95页 |
5.1 引言 | 第77-78页 |
5.2 相关工作 | 第78-79页 |
5.3 问题的建模与分析 | 第79-85页 |
5.3.1 作业执行机制 | 第79-80页 |
5.3.2 作业调度模型 | 第80-85页 |
5.3.3 并行度推断算法的问题定义 | 第85页 |
5.4 内存计算框架并行度推断算法 | 第85-89页 |
5.4.1 环境定义 | 第85-86页 |
5.4.2 构建基础数据 | 第86-87页 |
5.4.3 并行度推断算法 | 第87-89页 |
5.5 实验评价与比较 | 第89-94页 |
5.5.1 实验环境 | 第89-90页 |
5.5.2 并行度测试 | 第90-91页 |
5.5.3 参数评估实验 | 第91-92页 |
5.5.4 对比实验 | 第92-94页 |
5.6 本章小结 | 第94-95页 |
第6章 基于分配适应度的渐进填充分区映射算法 | 第95-118页 |
6.1 引言 | 第95-97页 |
6.2 相关工作 | 第97-98页 |
6.3 问题和建模与分析 | 第98-103页 |
6.3.1 作业执行机制 | 第98-99页 |
6.3.2 执行效率模型 | 第99-100页 |
6.3.3 Shuffle过程模型 | 第100-103页 |
6.3.4 目标定义 | 第103页 |
6.4 渐进填充分区映射算法 | 第103-111页 |
6.4.1 算法的总体描述 | 第103-105页 |
6.4.2 构建算法元数据 | 第105-106页 |
6.4.3 分区扩展算法 | 第106-107页 |
6.4.4 分区筛选算法 | 第107-109页 |
6.4.5 分区映射算法 | 第109-111页 |
6.5 实验评价与比较 | 第111-116页 |
6.5.1 实验环境 | 第111-112页 |
6.5.2 分区映射算法 | 第112-115页 |
6.5.3 对比实验 | 第115-116页 |
6.6 本章小结 | 第116-118页 |
第7章 基于回归检测的内存重复数据删除算法 | 第118-130页 |
7.1 引言 | 第118-119页 |
7.2 相关研究 | 第119-121页 |
7.3 滑动块检测技术的碎片分析 | 第121-123页 |
7.3.1 数据插入的碎片分析 | 第121-122页 |
7.3.2 数据删除的碎片分析 | 第122-123页 |
7.4 回归检测重复数据删除算法 | 第123-126页 |
7.4.1 折半匹配检测算法 | 第124-126页 |
7.4.2 二次滑动窗口检测算法 | 第126页 |
7.5 实验与比较 | 第126-129页 |
7.5.1 实验环境 | 第127页 |
7.5.2 结果与分析 | 第127-129页 |
7.6 本章小结 | 第129-130页 |
第8章 总结与展望 | 第130-134页 |
8.1 工作总结 | 第130-132页 |
8.2 未来工作及展望 | 第132-134页 |
参考文献 | 第134-151页 |
攻读博士学位期间主要的研究成果 | 第151-152页 |
致谢 | 第152-155页 |