摘要 | 第5-7页 |
Abstract | 第7-9页 |
第一章 绪论 | 第13-30页 |
1.1 大数据及大数据处理 | 第13-19页 |
1.1.1 大数据和大数据应用 | 第13-15页 |
1.1.2 大数据处理 | 第15-16页 |
1.1.3 大数据处理系统 | 第16-18页 |
1.1.4 大规模大数据处理平台—云计算平台 | 第18-19页 |
1.2 面向数据并行编程模型 | 第19-24页 |
1.2.1 面向数据并行编程模型 | 第19-21页 |
1.2.2 相关研究 | 第21-24页 |
1.3 大数据处理与大数据处理平台带来的挑战 | 第24-26页 |
1.4 本文的主要贡献 | 第26-28页 |
1.5 本文的结构安排 | 第28-30页 |
第二章 MapReduce编程模型及其支撑系统 | 第30-56页 |
2.1 MapReduce框架体系及其应用 | 第30-36页 |
2.1.1 MapReduce编程模型 | 第30-31页 |
2.1.2 MapReduce编程模型的支撑系统-Hadoop系统 | 第31-35页 |
2.1.3 弹性MapReduce及其易用性问题 | 第35-36页 |
2.2 MapReduce计算任务的执行及其资源配置优化 | 第36-43页 |
2.2.1 MapReduce计算任务执行过程 | 第37-38页 |
2.2.2 MapReduce计算任务执行过程中的资源配置优化问题 | 第38-40页 |
2.2.3 计算任务及其资源配置的形式化定义 | 第40-41页 |
2.2.4 MapReduce计算任务执行过程中的资源配置优化 | 第41-43页 |
2.3 多MapReduce计算任务并发调度过程中的资源配置优化 | 第43-50页 |
2.3.1 云计算平台的多任务并发调度概述 | 第44-45页 |
2.3.2 传统的多任务并发调度方法及资源配置优化 | 第45-46页 |
2.3.3 Hadoop支撑系统现有的多任务并发调度方法 | 第46-48页 |
2.3.4 现有多任务并发调度技术中存在的问题 | 第48-50页 |
2.4 实例分析:资源配置计划对MapReduce计算任务执行性能的影响 | 第50-55页 |
2.5 本章小结 | 第55-56页 |
第三章 计算任务运行概貌模型的构建和实现 | 第56-70页 |
3.1 计算任务运行概貌的定义和构建 | 第56-60页 |
3.1.1 计算任务运行概貌的定义 | 第56-57页 |
3.1.2 构建计算任务运行概貌 | 第57-60页 |
3.2 生成计算任务运行概貌 | 第60-64页 |
3.2.1 监测技术概述 | 第61-62页 |
3.2.2 运行状态探针 | 第62-64页 |
3.3 近似运行概貌 | 第64-65页 |
3.4 实验和评估 | 第65-69页 |
3.4.1 实验一:验证基于计算任务运行概貌分析的计算任务执行性能优化效果 | 第65-68页 |
3.4.2 实验二:验证计算任务近似运行概貌对计算任务运行概貌的可替代性 | 第68-69页 |
3.5 本章小结 | 第69-70页 |
第四章 基于PPO方法的MapReduce计算任务自调优系统 | 第70-108页 |
4.1 概述 | 第70-79页 |
4.1.1 传统数据处理调优技术 | 第71-72页 |
4.1.2 传统调优方法面临的挑战 | 第72-75页 |
4.1.3 大数据处理调优技术发展现状 | 第75-77页 |
4.1.4 PPO方法概述 | 第77-79页 |
4.2 MapReduce计算任务性能预测模型 | 第79-99页 |
4.2.1 MapReduce计算任务性能预测概述 | 第79-81页 |
4.2.2 总体设计思路 | 第81页 |
4.2.3 白盒基数模型及数据流统计字段值的估算过程 | 第81-82页 |
4.2.4 黑盒评估模型及成本统计字段值的估算过程 | 第82-85页 |
4.2.5 白盒分析模型及数据流状态字段和成本状态字段值的估算过程 | 第85-99页 |
4.3 MapReduce计算任务性能优化模型 | 第99-107页 |
4.3.1 MapReduce计算任务性能优化模型的形式化定义 | 第99-100页 |
4.3.2 计算任务配置参数优化 | 第100-105页 |
4.3.3 计算任务集群资源优化 | 第105-107页 |
4.4 本章小结 | 第107-108页 |
第五章 资源感知的自适应动态并发调度器研究 | 第108-124页 |
5.1 概述 | 第108-112页 |
5.1.1 多任务并发调度中的用户Qos支持和资源管理技术发展现状 | 第109-111页 |
5.1.2 面临的挑战 | 第111页 |
5.1.3 RDS方法 | 第111-112页 |
5.2 资源感知的动态资源管理模型 | 第112-116页 |
5.2.1 动态资源管理模型的形式化描述 | 第113-114页 |
5.2.2 基于资源放置情况的计算任务效用评估模型 | 第114-116页 |
5.3 基于动态资源管理模型的资源放置算法 | 第116-119页 |
5.3.1 总体思路 | 第116页 |
5.3.2 算法描述 | 第116-119页 |
5.4 RDS调度器系统 | 第119-123页 |
5.4.1 系统体系架构 | 第119-120页 |
5.4.2 组成部件 | 第120-121页 |
5.4.3 工作机制 | 第121-122页 |
5.4.4 计算任务资源需求概貌 | 第122-123页 |
5.5 本章小结 | 第123-124页 |
第六章 资源配置优化系统评测 | 第124-149页 |
6.1 运行及评测环境 | 第124-127页 |
6.1.1 搭建Hadoop集群 | 第124-125页 |
6.1.2 搭建Hadoop集群下的运行环境 | 第125-127页 |
6.2 PPO自调优系统评测 | 第127-138页 |
6.2.1 评测实例 | 第127-128页 |
6.2.2 计算任务运行概貌模型评测 | 第128-130页 |
6.2.3 性能预测模型评测 | 第130-133页 |
6.2.4 性能调优模型评测 | 第133-138页 |
6.3 资源感知的自适应动态调度器评测 | 第138-147页 |
6.3.1 评测实例 | 第138-140页 |
6.3.2 实验一:基于放松时长约束的运行效果评测 | 第140-146页 |
6.3.3 实验二:基于缩紧时长约束的运行效果评测 | 第146-147页 |
6.4 本章小结 | 第147-149页 |
结论 | 第149-152页 |
本文总结 | 第149-150页 |
进一步的研究方向 | 第150-152页 |
参考文献 | 第152-166页 |
攻读博士学位期间取得的研究成果 | 第166-167页 |
致谢 | 第167-168页 |
附件 | 第168页 |