首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于细粒度监控的Spark优化研究

摘要第4-5页
Abstract第5页
第1章 绪论第8-18页
    1.1 研究课题背景第8-10页
        1.1.1 研究课题来源第8页
        1.1.2 研究目的与意义第8-10页
    1.2 国内外研究现状第10-14页
        1.2.1 分布式框架研究现状第10-11页
        1.2.2 Spark性能优化研究现状第11-13页
        1.2.3 Spark性能预测研究现状第13-14页
    1.3 主要研究内容第14-16页
    1.4 本文结构第16-18页
第2章 细粒度监控工具的设计与实现第18-29页
    2.1 Spark平台概述第18-20页
        2.1.1 Spark平台简介第18-19页
        2.1.2 Spark体系结构介绍第19-20页
    2.2 Spark监控模块设计第20-23页
        2.2.1 性能监控模块设计第20-23页
        2.2.2 资源监控系统设计第23页
    2.3 监控工具的实现第23-28页
        2.3.1 Spark日志解析第23-27页
        2.3.2 Spark与Ganglia的集成第27-28页
    2.4 本章小结第28-29页
第3章 Spark执行性能优化第29-47页
    3.1 数据序列化方式第29-31页
    3.2 Shuffle管理器第31-33页
    3.3 RDD的持久化第33-36页
    3.4 数据的压缩第36-44页
        3.4.1 各种压缩方式的性能第36-37页
        3.4.2 压缩算法的影响第37-39页
        3.4.3 数据类型的影响第39-40页
        3.4.4 压缩规模的影响第40-43页
        3.4.5 压缩策略的综合比较第43-44页
    3.5 资源调度对Spark性能的影响第44-45页
        3.5.1 内存的影响第44-45页
        3.5.2 Core数量和集群并发度第45页
    3.6 优化文件系统策略第45页
    3.7 本章小结第45-47页
第4章 Spark资源分配优化第47-55页
    4.1 性能预测模型介绍第47-48页
    4.2 Spark性能不变量第48页
    4.3 Stage执行时间边界评估第48-49页
    4.4 预测Task执行时间第49-51页
    4.5 Worker失败对Spark性能的影响第51-53页
    4.6 资源分配优化第53-54页
    4.7 本章小结第54-55页
第5章 Spark优化实验评估第55-73页
    5.1 Spark负载类型分析第55-56页
    5.2 Spark负载优化第56-65页
        5.2.1 图计算负载优化第56-61页
        5.2.2 机器学习负载优化第61-63页
        5.2.3 文本处理负载优化第63-65页
    5.3 Spark资源分配优化第65-71页
        5.3.1 验证Spark性能不变量第65-66页
        5.3.2 确定回归系数第66-68页
        5.3.3 预测Spark作业完成时间第68-69页
        5.3.4 Worker故障下预测Spark作业完成时间第69-70页
        5.3.5 验证基于DeadLine的资源分配模型第70-71页
    5.4 本章小结第71-73页
结论第73-75页
参考文献第75-78页
攻读硕士学位期间发表的论文及其它成果第78-80页
致谢第80页

论文共80页,点击 下载论文
上一篇:大学生马克思主义信仰问题及对策研究
下一篇:陆贵山文艺理论中“真”与“美”思想