首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce大数据连接算法优化研究

摘要第3-4页
Abstract第4-5页
第一章 绪论第8-14页
    1.1 研究背景及意义第8-9页
    1.2 国内外研究现状第9-12页
    1.3 本文研究内容第12页
    1.4 论文组织结构第12-14页
第二章 大数据及关键技术第14-26页
    2.1 Hadoop简介第14-15页
    2.2 HDFS简介第15-17页
        2.2.1 HDFS基础知识第15-16页
        2.2.2 HDFS体系结构第16页
        2.2.3 数据错误与恢复机制第16-17页
    2.3 MapReduce编程框架第17-21页
        2.3.1 MapReduce概述第17-19页
        2.3.2 MapReduce调度流程第19-21页
    2.4 MapReduce中的连接算法与数据倾斜问题第21-25页
        2.4.1 连接简介第21页
        2.4.2 MapReduce中的二元连接算法第21-23页
        2.4.3 MapReduce倾斜问题介绍第23-25页
    2.5 本章小结第25-26页
第三章 基于key代价的大数据连接算法设计第26-37页
    3.1 Hadoop默认分区策略第26-27页
    3.2 基于key分区策略第27-28页
    3.3 MapReduce二元连接算法优化问题研究第28-34页
        3.3.1 二元连接查询的I/O代价分析第28-30页
        3.3.2 基于抽样估计的key代价分区方案第30-31页
        3.3.3 抽样技术第31-32页
        3.3.4 分区算法第32-34页
    3.4 基于key代价分区算法在Hadoop上的实现第34-35页
    3.5 本章小结第35-37页
第四章 实验结果与分析第37-41页
    4.1 实验设置第37页
    4.2 实验分析第37-40页
    4.3 本章小结第40-41页
第五章 总结与展望第41-43页
参考文献第43-47页
攻读硕士学位期间的研究成果第47-48页
致谢第48页

论文共48页,点击 下载论文
上一篇:颜色空间特征研究及在水质检测中的应用
下一篇:基于机器视觉的全自动高精度铆钉筛选系统