首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于hadoop的连接算法中数据倾斜问题的研究

摘要第1-6页
ABSTRACT第6-7页
目录第7-10页
表格第10-11页
插图第11-12页
算法第12-13页
第一章 绪论第13-19页
   ·论文研究背景第13-16页
     ·大数据的处理需求第13-14页
     ·大数据的概念和特征第14-15页
     ·传统数据库的局限性第15-16页
   ·研究问题的提出第16-17页
   ·本文的研究内容第17页
   ·本文的组织结构第17-18页
   ·本章小结第18-19页
第二章 Hadoop和map/reduce简介第19-31页
   ·hadoop简介第19-24页
     ·hadoop发展历程第19-20页
     ·HDFS简介第20-24页
   ·map/reduce简介第24-30页
     ·map/reduce整体框架第24-25页
     ·map/reduce任务完整执行步骤第25-27页
     ·map/reduce作业流程第27-28页
     ·map/reduce简单示例第28-30页
   ·本章小结第30-31页
第三章 hadoop中join算法介绍第31-37页
   ·map端连接算法第31-32页
   ·reduce端连接算法n第32-37页
     ·标准哈希连接第32-33页
     ·改进哈希连接第33-35页
     ·半连接第35-37页
第四章 hadoop join算法中的数据倾斜问题第37-57页
   ·hadoop环境下数据倾斜问题介绍第37-39页
   ·数据倾斜问题的处理第39-57页
     ·数据的预处理第39-42页
     ·两表等值join中的数据倾斜问题第42-46页
     ·多表等值join中的数据倾斜问题第46-52页
     ·完整的算法实现第52-57页
第五章 实验结果第57-67页
   ·实验环境第57页
   ·实验数据第57-58页
   ·两表连接算法第58-63页
     ·变动数据倾斜率比较EQJ, TRPJ和DPJ第58-60页
     ·变动数据量比较EQJ,TRPJ和DPJ第60-61页
     ·变动数据取值范围比较EQJ, TRPJ和DPJ第61-62页
     ·变动reduce个数比较EQJ,TRPJ和DPJ第62-63页
   ·多表连接算法第63-67页
     ·变动数据量比较RPJ, TT和MWJ第63-64页
     ·变动数据倾斜率量比较RPJ, TT和MWJ第64-67页
第六章 总结与展望第67-69页
   ·本文总结第67-68页
   ·展望第68-69页
参考文献第69-73页
致谢第73-75页
在读期间发表的学术论文与取得的研究成果第75页

论文共75页,点击 下载论文
上一篇:基于距离场的可变形物体注册和建模
下一篇:基于GPU的LOF算法加速