基于Kubemetes的大数据流式计算Spark平台设计与实现

摘要	第4-5页
abstract	第5-6页
第一章绪论	第9-14页
1.1 课题背景及研究意义	第9-12页
1.1.1 课题背景	第9-10页
1.1.2 基于容器部署大数据平台的意义	第10-12页
1.2 国内外相关课题研究现状	第12页
1.3 课题来源及本课题主要研究内容	第12-13页
1.4 本文研究内容和组织结构	第13-14页
第二章相关背景知识介绍	第14-31页
2.1 云计算与大数据	第14-17页
2.1.1 虚拟化技术概述	第14-15页
2.1.2 大数据流式计算框架Spark介绍	第15-17页
2.2 Docker容器相关技术概述	第17-22页
2.2.1 Docker基本概念	第17-18页
2.2.2 Docker总体构架	第18-19页
2.2.3 Docker核心技术namespace和cgroups研究	第19-21页
2.2.4 Docker容器与虚拟机比较	第21-22页
2.3 Kubernetes相关技术概述	第22-30页
2.3.1 Kubernetes核心概念	第22-25页
2.3.2 Kubernetes总体构架及工作流程	第25-27页
2.3.3 Kubernetes Master控制节点简介	第27-29页
2.3.4 Kubernetes Node工作节点简介	第29-30页
2.4 本章小结	第30-31页
第三章基于Kubernetes的Spark大数据平台设计与实现	第31-45页
3.1 Kubernetes网络模型分析	第31-35页
3.1.1 Docker网络模式分析	第31-33页
3.1.2 Docker容器跨主机访问解决方案分析	第33-34页
3.1.3 Kubernetes的网络实现	第34-35页
3.2 Spark通信机制分析	第35-37页
3.3 Kubernetes部署Spark设计与实现	第37-43页
3.3.1 Kubernetes部署Spark集群整体构架设计与实现	第37-39页
3.3.2 Spark Master容器与Spark Worker容器通信设计与实现	第39-41页
3.3.3 Spark Worker容器之间数据传输设计	第41-42页
3.3.4 Spark Client访问Spark Webui	第42-43页
3.4 基于Kubernetes部署Spark集群优势分析	第43-44页
（1）高资源利用率与隔离	第43页
（2）开发、测试和发布一体化	第43-44页
（3）提高计算并行度和能效比	第44页
3.5 本章小结	第44-45页
第四章基于Kubernetes的Spark节点弹性伸缩设计与实现	第45-54页
4.1 Pod资源管理	第45-46页
4.2 Kubernetes平台容器资源使用监控	第46-48页
4.2.1 Kubernetes Node单节点资源数据采集cAdvisor	第46-47页
4.2.2 Kubernetes集群资源数据聚合Heapster	第47-48页
4.3 水平Pod弹性伸缩系统构架分析	第48-49页
4.3.1 基于Pod的弹性伸缩框架	第48-49页
4.3.2 基于Pod的弹性伸缩算法	第49页
4.4 Spark节点弹性伸缩系统设计	第49-53页
4.5 本章小结	第53-54页
第五章平台部署与测试	第54-62页
5.1 Kubernetes集群配置	第54-55页
5.2 Kubernetes集群搭建步骤	第55-58页
5.3 通过dockerfile文件构建Spark镜像	第58-59页
5.4 启动Spark集群并测试弹性伸缩	第59-61页
5.5 本章小结	第61-62页
第六章总结与展望	第62-64页
6.1 工作总结	第62-63页
6.2 工作展望	第63-64页
参考文献	第64-66页
附录1 攻读硕士学位期间申请的专利	第66-67页
附录2 攻读硕士学位期间参加的科研项目	第67-68页
致谢	第68页