首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

一种面向MAPREDUCE的DATASHUFFLE的优化方法

摘要第4-5页
Abstract第5页
第一章 绪论第9-14页
    1.1 课题背景第9-10页
    1.2 课题研究内容第10-11页
    1.3 课题研究意义第11-12页
    1.4 文章组织结构第12-14页
第二章 相关研究及现状.第14-21页
    2.1 大数据研究现状第14-15页
    2.2 Hadoop平台研究现状第15-16页
    2.3 Map Reduce分区算法研究现状第16-18页
        2.3.1 对公平性的研究第16页
        2.3.2 对数据本地性的研究第16-17页
        2.3.3 对两者综合的研究第17-18页
    2.4 Map Reduce参数调优研究现状第18-20页
        2.4.1 基于经验的参数调优第18页
        2.4.2 基于作业反馈的参数调优第18-19页
        2.4.3 基于成本计算的参数调优第19页
        2.4.4 基于标签的参数调优第19-20页
    2.5 本章小结第20-21页
第三章 Hadoop平台简介第21-30页
    3.1 Hadoop组织结构第21-24页
        3.1.1 文件系统介绍第21-22页
        3.1.2 计算框架第22-23页
        3.1.3 Hadoop RPC框架第23-24页
    3.2 离线计算框架Map Reduce第24-28页
        3.2.1 数据准备阶段第25页
        3.2.2 Map阶段第25-26页
        3.2.3 Shuffle阶段第26-27页
        3.2.4 Reduce阶段第27-28页
    3.3 Partitioner分区函数接口第28-29页
    3.4 内核调试工具第29页
    3.5 本章小结第29-30页
第四章 LRP分区算法的设计与实现第30-40页
    4.1 TOP算法介绍第30-31页
    4.2 本地性分区策略第31-32页
    4.3 LRP算法描述第32-35页
        4.3.1 理论证明第32-34页
        4.3.2 算法描述第34-35页
    4.4 实验结果及分析第35-38页
        4.4.1 实验平台第35-36页
        4.4.2 Hot Path测试第36-37页
        4.4.3 Tera Sort测试第37-38页
    4.5 本章小结第38-40页
第五章 APAC系统的设计与实现第40-51页
    5.1 Hadoop分区函数的配置现状第40-41页
    5.2 APAC系统概述第41-42页
        5.2.1 作业特征的定义第41-42页
        5.2.2 系统结构介绍第42页
    5.3 模式聚类模块第42-46页
        5.3.1 数据收集和标准化处理第43-44页
        5.3.2 作业聚类第44-45页
        5.3.3 分区算法选择第45-46页
    5.4 在线识别模块第46-48页
        5.4.1 作业试运行第47页
        5.4.2 模式识别和参数配置第47-48页
        5.4.3 代价分析第48页
    5.5 实验结果及分析第48-50页
    5.6 本章小结第50-51页
第六章 总结与展望第51-53页
    6.1 全文总结第51-52页
    6.2 工作展望第52-53页
参考文献第53-58页
攻读硕士学位期间发表的论文第58-59页
致谢第59-60页

论文共60页,点击 下载论文
上一篇:基于振动抑制的高带宽多轴轮廓跟踪控制研究
下一篇:《高等教育体系对比分析》(第三章)翻译实践报告