摘要 | 第2-4页 |
abstract | 第4-6页 |
第1章 绪论 | 第10-22页 |
1.1 课题来源 | 第10页 |
1.2 研究背景及意义 | 第10-13页 |
1.3 流式大数据处理模式 | 第13-17页 |
1.3.1 高性能批量计算模式 | 第13-14页 |
1.3.2 批量—流式计算混合模式 | 第14-15页 |
1.3.3 流式计算模式 | 第15-17页 |
1.4 论文主要研究工作 | 第17-22页 |
1.4.1 论文研究内容 | 第17-18页 |
1.4.2 主要创新点 | 第18-19页 |
1.4.3 论文组织结构 | 第19-22页 |
第2章 流式计算框架及其任务调度研究现状 | 第22-35页 |
2.1 早期流式计算框架简介及其调度研究 | 第22-24页 |
2.1.1 早期流式计算框架简介 | 第22-23页 |
2.1.2 早期流式计算框架的调度优化方法研究 | 第23-24页 |
2.2 Storm框架及其调度优化方法研究 | 第24-34页 |
2.2.1 Storm框架简介 | 第25-28页 |
2.2.1.1 Storm系统架构 | 第25-26页 |
2.2.1.2 相关概念简介 | 第26-28页 |
2.2.1.3 Storm调度策略及自定义调度器 | 第28页 |
2.2.2 Storm框架任务调度优化方法研究现状 | 第28-34页 |
2.2.2.1 降低通信开销 | 第29-30页 |
2.2.2.2 优化资源分配 | 第30-31页 |
2.2.2.3 负载均衡 | 第31-32页 |
2.2.2.4 提升系统弹性 | 第32-34页 |
2.3 存在的问题 | 第34页 |
2.4 本章小结 | 第34-35页 |
第3章 流式计算框架下关联任务感知的任务调度策略 | 第35-56页 |
3.1 引言 | 第35-36页 |
3.2 相关研究 | 第36-37页 |
3.3 Storm基本模型 | 第37-40页 |
3.3.1 拓扑逻辑模型 | 第37-38页 |
3.3.2 拓扑实例模型 | 第38-39页 |
3.3.3 任务分配模型 | 第39-40页 |
3.4 问题建模与分析 | 第40-43页 |
3.4.1 任务数量约束模型 | 第40-41页 |
3.4.2 最优数据流通信模型 | 第41-43页 |
3.4.3 关联任务感知的任务调度问题定义 | 第43页 |
3.5 关联任务感知的任务调度策略 | 第43-48页 |
3.5.1 广度优先的组件遍历算法 | 第43-44页 |
3.5.2 关联任务感知的任务分配算法 | 第44-45页 |
3.5.3 一个例子 | 第45-47页 |
3.5.4 算法评估 | 第47-48页 |
3.6 实验与评价 | 第48-55页 |
3.6.1 实验环境 | 第48-49页 |
3.6.2 任务调度结果测试 | 第49-51页 |
3.6.3 节点间通信开销测试 | 第51-53页 |
3.6.4 延迟测试 | 第53-55页 |
3.7 本章小结 | 第55-56页 |
第4章 流式计算框架下基于权重的任务调度算法 | 第56-75页 |
4.1 引言 | 第56-57页 |
4.2 相关研究 | 第57-58页 |
4.3 问题建模与分析 | 第58-61页 |
4.3.1 带权拓扑模型 | 第58-59页 |
4.3.2 负载均衡模型 | 第59-60页 |
4.3.3 最优通信开销模型 | 第60-61页 |
4.4 基于权重的任务调度算法 | 第61-67页 |
4.4.1 数据流增益的概念 | 第61-62页 |
4.4.2 算法描述 | 第62-63页 |
4.4.3 算法解释与算法评估 | 第63-64页 |
4.4.4 算法实现与部署 | 第64-67页 |
4.5 实验与评价 | 第67-74页 |
4.5.1 实验环境 | 第67-69页 |
4.5.2 延迟测试 | 第69-71页 |
4.5.3 通信开销测试 | 第71-72页 |
4.5.4 负载均衡测试 | 第72-74页 |
4.6 本章小结 | 第74-75页 |
第5章 流式计算框架的任务迁移策略 | 第75-105页 |
5.1 引言 | 第75-76页 |
5.2 相关研究 | 第76-77页 |
5.3 问题建模与分析 | 第77-81页 |
5.3.1 资源约束模型 | 第77-79页 |
5.3.2 任务迁移模型 | 第79-81页 |
5.4 任务迁移策略 | 第81-92页 |
5.4.1 源节点选择算法 | 第82-83页 |
5.4.2 任务迁移算法 | 第83-87页 |
5.4.3 算法评估 | 第87-91页 |
5.4.3.1 算法复杂度分析 | 第87页 |
5.4.3.2 算法执行效果分析 | 第87-91页 |
5.4.4 算法实现与部署 | 第91-92页 |
5.5 实验与评价 | 第92-103页 |
5.5.1 实验环境 | 第92-96页 |
5.5.2 延迟测试 | 第96-99页 |
5.5.3 资源占用测试 | 第99-102页 |
5.5.4 节点间通信开销测试 | 第102页 |
5.5.5 真实应用场景下的测试 | 第102-103页 |
5.6 本章小结 | 第103-105页 |
第6章 基于任务迁移的流式计算弹性集群构建方法 | 第105-123页 |
6.1 引言 | 第105-106页 |
6.2 相关研究 | 第106-107页 |
6.3 问题建模与分析 | 第107-110页 |
6.3.1 改进的资源约束模型 | 第107-108页 |
6.3.2 扩充的任务迁移模型 | 第108-110页 |
6.4 基于任务迁移的流式计算弹性集群构建方法 | 第110-115页 |
6.4.1 基于任务迁移的集群动态扩展算法 | 第110-113页 |
6.4.2 基于任务迁移的集群动态收缩算法 | 第113-115页 |
6.5 实验与评价 | 第115-122页 |
6.5.1 实验环境 | 第115-117页 |
6.5.2 DCGA有效性测试 | 第117-120页 |
6.5.3 DCSA有效性测试 | 第120-122页 |
6.6 本章小结 | 第122-123页 |
第7章 总结与展望 | 第123-127页 |
7.1 工作总结 | 第123-125页 |
7.2 未来工作及展望 | 第125-127页 |
参考文献 | 第127-141页 |
攻读博士学位期间主要的研究成果 | 第141-143页 |
致谢 | 第143-146页 |