集群计算引擎Spark中的内存优化研究与实现

摘要	第1-4页
Abstract	第4-8页
第1章引言	第8-15页
·并行计算概述	第8-10页
·MapReduce模型	第8-9页
·Dryad模型	第9-10页
·Pregal模型	第10页
·MapReduce现状	第10-12页
·本文贡献	第12-13页
·本章小结	第13-15页
第2章并行计算框架Spark	第15-23页
·Spark简述	第15-17页
·Spark Job编写	第16-17页
·Spark的体系结构	第17-22页
·资源管理框架Mesos	第17-18页
·Spark的设计思想	第18页
·Spark的实现	第18-19页
·PageRank实例分析	第19-22页
·本章小结	第22-23页
第3章 Spark的内存使用自动优化方案	第23-32页
·缓存自动化	第23-27页
·背景	第23-26页
·自动化方案	第26-27页
·缓存替换策略优化	第27-30页
·在虚拟集群系统下的行为优化	第30-31页
·本章小结	第31-32页
第4章 Spark优化方案实现	第32-51页
·缓存策略自动化实现	第32-34页
·动态分析	第32-33页
·静态分析	第33-34页
·结果呈现方式	第34页
·缓存替换策略优化实现	第34-49页
·Action顺序优化	第35-39页
·RDD权重计算	第39-43页
·替换策略优化	第43-48页
·多级缓存策略	第48-49页
·本章小结	第49-51页
第5章实验与评价	第51-62页
·实验方法和目的	第51页
·实验环境	第51-52页
·实验环境安装	第52-55页
·适用范围	第52页
·需要root权限的步骤	第52-53页
·软件安装路径	第53页
·Mesos安装	第53-54页
·Spark安装	第54页
·Hadoop安装	第54-55页
·实验任务	第55页
·实验结果与分析	第55-61页
·实验一Logistic Regression	第55-57页
·实验二sortBykey	第57-58页
·实验三不同缓存策略比较	第58-59页
·实验四Action顺序效果实验	第59-60页
·实验五多级缓存效果实验	第60-61页
·本章小结	第61-62页
第6章总结	第62-66页
·本文总结	第62-63页
·下一步工作	第63-66页
参考文献	第66-69页
致谢	第69-71页
个人简历、在学期间发表的学术论文与研究成果	第71页