摘要 | 第4-5页 |
abstract | 第5-6页 |
第一章 绪论 | 第9-14页 |
1.1 课题背景及研究意义 | 第9-12页 |
1.1.1 课题背景 | 第9-10页 |
1.1.2 基于容器部署大数据平台的意义 | 第10-12页 |
1.2 国内外相关课题研究现状 | 第12页 |
1.3 课题来源及本课题主要研究内容 | 第12-13页 |
1.4 本文研究内容和组织结构 | 第13-14页 |
第二章 相关背景知识介绍 | 第14-31页 |
2.1 云计算与大数据 | 第14-17页 |
2.1.1 虚拟化技术概述 | 第14-15页 |
2.1.2 大数据流式计算框架Spark介绍 | 第15-17页 |
2.2 Docker容器相关技术概述 | 第17-22页 |
2.2.1 Docker基本概念 | 第17-18页 |
2.2.2 Docker总体构架 | 第18-19页 |
2.2.3 Docker核心技术namespace和cgroups研究 | 第19-21页 |
2.2.4 Docker容器与虚拟机比较 | 第21-22页 |
2.3 Kubernetes相关技术概述 | 第22-30页 |
2.3.1 Kubernetes核心概念 | 第22-25页 |
2.3.2 Kubernetes总体构架及工作流程 | 第25-27页 |
2.3.3 Kubernetes Master控制节点简介 | 第27-29页 |
2.3.4 Kubernetes Node工作节点简介 | 第29-30页 |
2.4 本章小结 | 第30-31页 |
第三章 基于Kubernetes的Spark大数据平台设计与实现 | 第31-45页 |
3.1 Kubernetes网络模型分析 | 第31-35页 |
3.1.1 Docker网络模式分析 | 第31-33页 |
3.1.2 Docker容器跨主机访问解决方案分析 | 第33-34页 |
3.1.3 Kubernetes的网络实现 | 第34-35页 |
3.2 Spark通信机制分析 | 第35-37页 |
3.3 Kubernetes部署Spark设计与实现 | 第37-43页 |
3.3.1 Kubernetes部署Spark集群整体构架设计与实现 | 第37-39页 |
3.3.2 Spark Master容器与Spark Worker容器通信设计与实现 | 第39-41页 |
3.3.3 Spark Worker容器之间数据传输设计 | 第41-42页 |
3.3.4 Spark Client访问Spark Webui | 第42-43页 |
3.4 基于Kubernetes部署Spark集群优势分析 | 第43-44页 |
(1)高资源利用率与隔离 | 第43页 |
(2)开发、测试和发布一体化 | 第43-44页 |
(3)提高计算并行度和能效比 | 第44页 |
3.5 本章小结 | 第44-45页 |
第四章 基于Kubernetes的Spark节点弹性伸缩设计与实现 | 第45-54页 |
4.1 Pod资源管理 | 第45-46页 |
4.2 Kubernetes平台容器资源使用监控 | 第46-48页 |
4.2.1 Kubernetes Node单节点资源数据采集cAdvisor | 第46-47页 |
4.2.2 Kubernetes集群资源数据聚合Heapster | 第47-48页 |
4.3 水平Pod弹性伸缩系统构架分析 | 第48-49页 |
4.3.1 基于Pod的弹性伸缩框架 | 第48-49页 |
4.3.2 基于Pod的弹性伸缩算法 | 第49页 |
4.4 Spark节点弹性伸缩系统设计 | 第49-53页 |
4.5 本章小结 | 第53-54页 |
第五章 平台部署与测试 | 第54-62页 |
5.1 Kubernetes集群配置 | 第54-55页 |
5.2 Kubernetes集群搭建步骤 | 第55-58页 |
5.3 通过dockerfile文件构建Spark镜像 | 第58-59页 |
5.4 启动Spark集群并测试弹性伸缩 | 第59-61页 |
5.5 本章小结 | 第61-62页 |
第六章 总结与展望 | 第62-64页 |
6.1 工作总结 | 第62-63页 |
6.2 工作展望 | 第63-64页 |
参考文献 | 第64-66页 |
附录1 攻读硕士学位期间申请的专利 | 第66-67页 |
附录2 攻读硕士学位期间参加的科研项目 | 第67-68页 |
致谢 | 第68页 |