首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向倾斜数据的MapReduce连接算法研究

摘要第5-6页
ABSTRACT第6页
第1章 绪论第9-12页
    1.1 课题背景第9-10页
    1.2 理论意义和应用价值第10-11页
    1.3 主要研究内容第11-12页
第2章 相关技术介绍第12-22页
    2.1 云计算介绍第12-15页
        2.1.1 云计算定义第12页
        2.1.2 云计算特征第12-13页
        2.1.3 云计算核心技术第13-14页
        2.1.4 云计算分类第14-15页
    2.2 Hadoop介绍第15-21页
        2.2.1 HDFS工作原理第16-17页
        2.2.2 MapReduce工作原理第17-21页
    2.3 本章小结第21-22页
第3章 MapReduce中的连接算法与倾斜问题第22-28页
    3.1 连接查询第22页
    3.2 MapReduce中的二元连接算法第22-24页
        3.2.1 标准重分区算法第23页
        3.2.2 改进重分区算法第23-24页
        3.2.3 广播连接第24页
        3.2.4 半连接算法第24页
    3.3 MapReduce中的倾斜问题第24-27页
        3.3.1 倾斜问题分类第24-25页
        3.3.2 倾斜问题解决方案第25-27页
    3.4 本章小结第27-28页
第4章 基于抽样估计的倾斜数据连接算法设计第28-46页
    4.1 MapReduce中常用分区第28-31页
        4.1.1 哈希分区第28-29页
        4.1.2 值域分区第29-31页
    4.2 二元连接中的数据倾斜问题研究第31-42页
        4.2.1 二元连接的I/O代价第31-33页
        4.2.2 基于抽样估计的数据划分方案第33-34页
        4.2.3 MapReduce中的蓄水池抽样第34-36页
        4.2.4 簇组合连接算法设计第36-39页
        4.2.5 簇分割组合连接算法设计第39-42页
    4.3 多元连接中的数据倾斜问题研究第42-45页
        4.3.1 多元连接方法第42-43页
        4.3.2 值域复制连接算法设计第43-45页
    4.4 本章小结第45-46页
第5章 实验结果与分析第46-56页
    5.1 实验环境第46-47页
        5.1.1 实验平台第46页
        5.1.2 实验数据第46-47页
    5.2 实验方案与结果分析第47-55页
        5.2.1 二元连接运算第47-54页
        5.2.2 多元连接运算第54-55页
    5.3 本章小结第55-56页
第6章 总结与展望第56-58页
    6.1 本文总结第56页
    6.2 展望第56-58页
参考文献第58-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:SBA-15介孔材料上胰蛋白酶的固定化研究
下一篇:蛋清源ACE抑制肽的结构与完整吸收关系研究