首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于资源调度的MapReduce数据倾斜消除技术研究

摘要第10-12页
ABSTRACT第12-14页
第一章 绪论第15-44页
    1.1 大数据研究背景第15-21页
        1.1.1 大数据的起源与发展第15-16页
        1.1.2 主流的大数据处理平台第16-21页
    1.2 MapReduce研究现状第21-32页
        1.2.1 MapReduce编程模型第21-23页
        1.2.2 Hadoop YARN的资源管理机制第23-25页
        1.2.3 面向MapReduce的研究热点第25-32页
    1.3 数据倾斜问题研究现状第32-40页
        1.3.1 非实时数据倾斜消除方法第33-35页
        1.3.2 实时数据倾斜消除方法第35-38页
        1.3.3 现有研究的缺陷第38-40页
    1.4 主要研究工作及贡献第40-42页
    1.5 文章结构第42-44页
第二章 实时的redcue任务负载估计方法第44-72页
    2.1 研究动机第44-46页
    2.2 reduce任务负载的构成第46-47页
    2.3 基于线性回归的reduce任务负载估计方法第47-51页
        2.3.1 算法设计第48-50页
        2.3.2 具体实现第50-51页
    2.4 基于重采样的reduce任务负载估计方法第51-59页
        2.4.1 工作流程第51-52页
        2.4.2 负载的估计量及其精度估计第52-57页
        2.4.3 具体实现第57-59页
    2.5 性能评价第59-65页
        2.5.1 精确度评价第61-64页
        2.5.2 鲁棒性分析第64-65页
    2.6 负载估计技术的应用验证第65-70页
    2.7 小结第70-72页
第三章 基于工作档案的划分倾斜消除方法第72-97页
    3.1 研究动机第72-74页
    3.2 系统架构第74-76页
    3.3 DREAMS设计第76-83页
        3.3.1 reduce任务性能模型第76-81页
        3.3.2 动态资源分配算法第81-83页
    3.4 性能评价第83-95页
        3.4.1 负载估计的精确度第85-87页
        3.4.2 reduce任务性能模型的精确度第87-92页
        3.4.3 作业完成时间第92-95页
    3.5 讨论第95页
    3.6 小结第95-97页
第四章 基于超载任务检测的划分倾斜消除方法第97-111页
    4.1 研究动机第97-99页
    4.2 系统架构第99-100页
    4.3 OPTIMA设计第100-105页
        4.3.1 检测超载任务第100-103页
        4.3.2 动态资源分配算法第103-105页
    4.4 性能评价第105-109页
        4.4.1 负载估计的精确度第106页
        4.4.2 超载任务检测评估第106-107页
        4.4.3 作业完成时间第107-109页
    4.5 小结第109-111页
第五章 基于任务剩余时间估计的数据倾斜消除方法第111-128页
    5.1 研究动机第111-112页
    5.2 系统架构第112-114页
    5.3 DynamicAdjust设计第114-120页
        5.3.1 倾斜任务的实时检测技术第114-116页
        5.3.2 阶段感知的任务剩余时间估计第116-118页
        5.3.3 资源自适应机制第118-120页
    5.4 性能评价第120-126页
        5.4.1 倾斜任务检测的精确度第122-124页
        5.4.2 作业完成时间第124-126页
    5.5 小结第126-128页
第六章 总结与展望第128-132页
    6.1 工作总结第128-130页
    6.2 下一步工作第130-132页
致谢第132-135页
参考文献第135-145页
作者在学期间取得的学术成果第145-146页

论文共146页,点击 下载论文
上一篇:基于时域脉冲编码的长距离高空间分辨率光纤布里渊分布式传感技术研究
下一篇:非结构化网格分片线性矢量场高效可视化技术研究