首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于MapReduce大数据表连接查询处理算法优化与设计

摘要第4-5页
Abstract第5-6页
第1章 绪论第9-17页
    1.1 课题研究背景第9-12页
        1.1.1 大数据处理需求第9-10页
        1.1.2 大数据的概念及特点第10-11页
        1.1.3 传统数据库局限性综述第11-12页
    1.2 研究目的及意义第12-14页
    1.3 论文的主要工作第14页
    1.4 论文组织结构安排第14-17页
第2章 Hadoop相关技术及数据表连接算法第17-31页
    2.1 Hadoop相关技术第17-23页
        2.1.1 Hadoop文件系统第18-20页
        2.1.2 MapReduce编程模型第20页
        2.1.3 MapReduce计算模型第20-23页
    2.2 基于MapReduce的连接算法第23-29页
        2.2.1 基于Reduce的连接第23-25页
        2.2.2 基于MapReduce框架的连接算法第25-29页
    2.3 本章小结第29-31页
第3章 两表连接优化方法第31-45页
    3.1 ReduceSideJoin算法实现第31-33页
    3.2 RSJ算法局限性分析第33-34页
    3.3 基于分布式缓存机制的两表连接算法的优化第34-38页
        3.3.1 分布式缓存机制原理第34-35页
        3.3.2 Bit-map压缩算法第35-38页
    3.4 DRSJ算法的实现第38-41页
    3.5 DRSJ算法代价分析第41-43页
    3.6 本章小结第43-45页
第4章 多表连接优化方法第45-59页
    4.1 各多表连接算法综述第45-47页
    4.2 多表连接算法局限性分析第47页
    4.3 总体框架设计第47-50页
    4.4 协调机制的设计第50-56页
        4.4.1 协调模块的设计第50-51页
        4.4.2 流水线模型第51-53页
        4.4.3 多表连接策略第53-56页
    4.5 本章小结第56-59页
第5章 算法测试与分析第59-69页
    5.1 实验环境的配置及搭建第59-61页
    5.2 实验数据来源第61页
    5.3 两表连接实验第61-63页
    5.4 多表连接实验第63-66页
        5.4.1 网络与I/O代价对比第64-65页
        5.4.2 响应时间对比第65-66页
    5.5 本章小结第66-69页
结论第69-71页
参考文献第71-75页
攻读硕士学位期间取得的研究成果第75-77页
致谢第77页

论文共77页,点击 下载论文
上一篇:个性化医疗护理信息推荐系统的设计与实现
下一篇:基于IRT模型的智能自适应测试系统的研究与实现