集群计算引擎Spark中的内存优化研究与实现
摘要 | 第1-4页 |
Abstract | 第4-8页 |
第1章 引言 | 第8-15页 |
·并行计算概述 | 第8-10页 |
·MapReduce模型 | 第8-9页 |
·Dryad模型 | 第9-10页 |
·Pregal模型 | 第10页 |
·MapReduce现状 | 第10-12页 |
·本文贡献 | 第12-13页 |
·本章小结 | 第13-15页 |
第2章 并行计算框架Spark | 第15-23页 |
·Spark简述 | 第15-17页 |
·Spark Job编写 | 第16-17页 |
·Spark的体系结构 | 第17-22页 |
·资源管理框架Mesos | 第17-18页 |
·Spark的设计思想 | 第18页 |
·Spark的实现 | 第18-19页 |
·PageRank实例分析 | 第19-22页 |
·本章小结 | 第22-23页 |
第3章 Spark的内存使用自动优化方案 | 第23-32页 |
·缓存自动化 | 第23-27页 |
·背景 | 第23-26页 |
·自动化方案 | 第26-27页 |
·缓存替换策略优化 | 第27-30页 |
·在虚拟集群系统下的行为优化 | 第30-31页 |
·本章小结 | 第31-32页 |
第4章 Spark优化方案实现 | 第32-51页 |
·缓存策略自动化实现 | 第32-34页 |
·动态分析 | 第32-33页 |
·静态分析 | 第33-34页 |
·结果呈现方式 | 第34页 |
·缓存替换策略优化实现 | 第34-49页 |
·Action顺序优化 | 第35-39页 |
·RDD权重计算 | 第39-43页 |
·替换策略优化 | 第43-48页 |
·多级缓存策略 | 第48-49页 |
·本章小结 | 第49-51页 |
第5章 实验与评价 | 第51-62页 |
·实验方法和目的 | 第51页 |
·实验环境 | 第51-52页 |
·实验环境安装 | 第52-55页 |
·适用范围 | 第52页 |
·需要root权限的步骤 | 第52-53页 |
·软件安装路径 | 第53页 |
·Mesos安装 | 第53-54页 |
·Spark安装 | 第54页 |
·Hadoop安装 | 第54-55页 |
·实验任务 | 第55页 |
·实验结果与分析 | 第55-61页 |
·实验一Logistic Regression | 第55-57页 |
·实验二sortBykey | 第57-58页 |
·实验三不同缓存策略比较 | 第58-59页 |
·实验四Action顺序效果实验 | 第59-60页 |
·实验五多级缓存效果实验 | 第60-61页 |
·本章小结 | 第61-62页 |
第6章 总结 | 第62-66页 |
·本文总结 | 第62-63页 |
·下一步工作 | 第63-66页 |
参考文献 | 第66-69页 |
致谢 | 第69-71页 |
个人简历、在学期间发表的学术论文与研究成果 | 第71页 |