首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--电子数字计算机(不连续作用电子计算机)论文--各种电子数字计算机论文

Spark集群Shuffle机制研究

摘要第3-4页
abstract第4页
第1章 绪论第12-21页
    1.1 研究背景与意义第12-15页
    1.2 研究现状第15-19页
    1.3 主要研究工作第19页
    1.4 论文的组织架构第19-21页
第2章 技术基础第21-36页
    2.1 Spark框架概述第21-23页
    2.2 RDD第23-28页
        2.2.1 RDD的依赖第24-25页
        2.2.2 Spark算子分类第25-27页
        2.2.3 RDD的持久化第27-28页
    2.3 Spark运行机制第28-34页
        2.3.1 资源分配第29-30页
        2.3.2 作业执行第30-32页
        2.3.3 调度与任务分配第32-34页
    2.4 Spark和Hadoop的shuffle过程对比第34-35页
    2.5 本章小结第35-36页
第3章 优化的shuffle均衡调度策略第36-48页
    3.1 概述第36页
    3.2 相关工作第36-37页
    3.3 Shuffle机制第37-38页
    3.4 优化的shuffle机制第38-44页
        3.4.1 问题分析第38-40页
        3.4.2 Shuffle fetch优化第40-44页
    3.5 实验结果与分析第44-47页
        3.5.1 实验环境第44-45页
        3.5.2 结果与分析第45-47页
    3.6 本章小结第47-48页
第4章 基于本地性的分区策略第48-63页
    4.1 概述第48页
    4.2 相关工作第48-49页
    4.3 问题分析第49-53页
        4.3.1 数据倾斜第50-52页
        4.3.2 数据本地性第52-53页
    4.4 优化方案第53-56页
        4.4.1 基本定义第53-54页
        4.4.2 数据倾斜分析第54-56页
    4.5 基于本地性的分区策略第56-60页
        4.5.1 数据分布信息统计第56-58页
        4.5.2 数据集分布第58页
        4.5.3 分区策略第58-60页
    4.6 实验结果及分析第60-62页
        4.6.1 实验环境第60页
        4.6.2 结果与分析第60-62页
    4.7 本章小结第62-63页
第5章 总结与展望第63-65页
    5.1 总结第63-64页
    5.2 未来工作第64-65页
参考文献第65-70页
致谢第70-71页
攻读硕士学位期间从事的科研工作及取得的成果第71页

论文共71页,点击 下载论文
上一篇:基于OpenStack的资源调度机制研究
下一篇:舰载相控阵雷达信号处理系统的设计与实现