首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--一般性问题论文--理论、方法论文--算法理论论文

基于MapReduce的连接算法研究

摘要第5-7页
Abstract第7-8页
第1章 绪论第11-15页
    1.1 研究背景及意义第11-12页
    1.2 国内外研究现状第12-13页
    1.3 论文的主要内容第13页
    1.4 论文的组织结构第13-15页
第2章 Hadoop技术研究第15-24页
    2.1 Hadoop概述第15页
    2.2 HDFS详解第15-19页
        2.2.1 HDFS的设计目标第15-16页
        2.2.2 HDFS体系结构第16-19页
    2.3 MapReduce详解第19-23页
        2.3.1 MapReduce框架结构第20-21页
        2.3.2 MapReduce作业流程第21-23页
    2.4 本章小结第23-24页
第3章 基于MapReduce的连接算法介绍第24-29页
    3.1 连接第24-25页
        3.1.1 连接的定义第24页
        3.1.2 MapRedcue下的连接第24-25页
    3.2 map-join算法第25-26页
        3.2.1 广播算法第26页
        3.2.2 半连接算法第26页
    3.3 reduce-join算法第26-28页
        3.3.1 标准重分区连接算法第27页
        3.3.2 改进重分区连接算法第27页
        3.3.3 域分区连接算法第27-28页
    3.4 本章小结第28-29页
第4章 基于MapReduce的数据倾斜连接算法第29-38页
    4.1 MapReduce框架下的数据倾斜第29页
    4.2 基于直方图的数据分类第29-33页
        4.2.1 直方图介绍第30-31页
        4.2.2 基于直方图的数据分类第31-33页
    4.3 基于数据分类的连接算法第33-35页
        4.3.1 数据分发机制第33-34页
        4.3.2 基于MapReduce的连接算法第34-35页
    4.4 FC-Join算法分析第35-37页
    4.5 本章小结第37-38页
第5章 实验验证与结果分析第38-43页
    5.1 实验环境第38-39页
    5.2 实验结果及分析第39-42页
        5.2.1 倾斜度对执行时间的影响第39页
        5.2.2 倾斜度对shuffle阶段网络数据传输量的影响第39-40页
        5.2.3 数据规模对执行时间的影响第40-41页
        5.2.4 reduce个数对执行时间的影响第41-42页
    5.3 本章小结第42-43页
总结与展望第43-45页
参考文献第45-48页
附录:攻读硕士学位期间撰写的学术论文第48-49页
致谢第49页

论文共49页,点击 下载论文
上一篇:基于颜色和纹理特征的图像检索研究
下一篇:Web Service技术及其在贵州省税源专业化系统中的应用研究