摘要 | 第1-7页 |
ABSTRACT | 第7-9页 |
目录 | 第9-14页 |
表格 | 第14-15页 |
插图 | 第15-17页 |
算法 | 第17-18页 |
第一章 绪论 | 第18-28页 |
·论文研究背景 | 第18-21页 |
·大数据产生背景 | 第18-19页 |
·大数据概念和特征 | 第19-20页 |
·主流的大数据计算环境 | 第20-21页 |
·论文研究问题的提出 | 第21-24页 |
·基于MapReduce的直方图高效建立算法 | 第22-23页 |
·等值连接算法的设计与优化 | 第23页 |
·数据倾斜时的连接算法的设计与优化 | 第23-24页 |
·任意连接算法的设计与优化 | 第24页 |
·论文主要研究工作 | 第24-27页 |
·论文研究内容 | 第24-25页 |
·论文组织结构 | 第25-27页 |
·本章小结 | 第27-28页 |
第二章 基于MapReduce的大数据处理研究综述 | 第28-44页 |
·引言 | 第28-29页 |
·数据处理架构 | 第29-33页 |
·并行数据库 | 第29-30页 |
·MapReduce | 第30-32页 |
·混合数据处理平台 | 第32-33页 |
·基于MapReduce的数据处理算法综述 | 第33-42页 |
·基于MapReduce的连接算法优化 | 第33-40页 |
·基于MapReduce的迭代优化算法 | 第40-41页 |
·MapReduce的调度算法综述 | 第41-42页 |
·本章小结 | 第42-44页 |
第三章 基于MapReduce的Maxdiff直方图建立算法 | 第44-60页 |
·引言 | 第44-45页 |
·背景及相关工作介绍 | 第45-47页 |
·直方图的定义 | 第45-47页 |
·直方图的相关工作介绍 | 第47页 |
·基于MapReduce的Maxdiff直方图的精确算法 | 第47-51页 |
·基于MapReduce的Maxdiff直方图的近似算法 | 第51-54页 |
·实验 | 第54-58页 |
·本章小结 | 第58-60页 |
第四章 基于BloomFilter的等值连接算法的设计与优化 | 第60-86页 |
·引言 | 第60-61页 |
·背景及相关工作介绍 | 第61-64页 |
·BloomFilter的背景及相关工作介绍 | 第61-63页 |
·基于MapReduce的等值连接背景及相关工作介绍 | 第63-64页 |
·基于MapReduce的BloomFilter建立算法 | 第64-69页 |
·算法描述 | 第64-68页 |
·实验与分析 | 第68-69页 |
·基于BloomFilter的等值连接算法 | 第69-76页 |
·两表等值连接算法 | 第70-75页 |
·多表等值连接算法 | 第75-76页 |
·基于BloomFilter的连接算法代价模型 | 第76-82页 |
·BloomFilter建立的代价模型 | 第77-78页 |
·两表等值连接的代价模型 | 第78-80页 |
·多表等值连接的代价模型 | 第80-81页 |
·模型验证 | 第81-82页 |
·本章小结 | 第82-86页 |
第五章 数据倾斜的连接算法的设计与优化 | 第86-106页 |
·引言 | 第86-87页 |
·相关工作介绍 | 第87-88页 |
·两表数据倾斜的等值连接算法 | 第88-92页 |
·算法设计 | 第89-91页 |
·与range partition分区方法对比 | 第91-92页 |
·多表数据倾斜的等值连接算法优化 | 第92-95页 |
·算法设计 | 第93-94页 |
·数据分区 | 第94-95页 |
·算法整体描述 | 第95页 |
·与多表等值连接算法做对比 | 第95页 |
·实验 | 第95-100页 |
·两表数据倾斜的实验和实验分析 | 第95-100页 |
·多表数据倾斜的实验和实验分析 | 第100页 |
·本章小结 | 第100-106页 |
第六章 任意连接算法的设计与优化 | 第106-126页 |
·引言 | 第106-107页 |
·相关工作介绍 | 第107页 |
·Strict-Even-Join的算法设计 | 第107-116页 |
·算法设计 | 第108-112页 |
·数据分区 | 第112页 |
·完整算法描述 | 第112-113页 |
·数据集倾斜时的分析 | 第113页 |
·与1-Bucket-Theta算法对比 | 第113-114页 |
·与多表等值连接算法对比 | 第114-116页 |
·基于MapReduce多表任意连接算法优化 | 第116-118页 |
·算法描述 | 第116-117页 |
·MapReduce的并发控制 | 第117-118页 |
·基于MapReduce的任意连接的代价模型 | 第118-121页 |
·任意连接的代价模型 | 第119-120页 |
·等值连接的代价模型 | 第120-121页 |
·实验 | 第121-123页 |
·一轮MapReduce任意连接算法实验 | 第121-122页 |
·优化多表任意连接实验 | 第122-123页 |
·本章小结 | 第123-126页 |
第七章 总结与展望 | 第126-130页 |
·本文工作总结 | 第126-127页 |
·贡献及创新点 | 第127-128页 |
·进一步的工作 | 第128-130页 |
参考文献 | 第130-138页 |
致谢 | 第138-140页 |
在读期间发表的学术论文与取得的研究成果 | 第140-142页 |
攻读博士学位期间参加的科研项目 | 第142页 |
攻读博士学位期间获得的奖励 | 第142页 |