| 摘要 | 第1-7页 |
| ABSTRACT | 第7-9页 |
| 目录 | 第9-14页 |
| 表格 | 第14-15页 |
| 插图 | 第15-17页 |
| 算法 | 第17-18页 |
| 第一章 绪论 | 第18-28页 |
| ·论文研究背景 | 第18-21页 |
| ·大数据产生背景 | 第18-19页 |
| ·大数据概念和特征 | 第19-20页 |
| ·主流的大数据计算环境 | 第20-21页 |
| ·论文研究问题的提出 | 第21-24页 |
| ·基于MapReduce的直方图高效建立算法 | 第22-23页 |
| ·等值连接算法的设计与优化 | 第23页 |
| ·数据倾斜时的连接算法的设计与优化 | 第23-24页 |
| ·任意连接算法的设计与优化 | 第24页 |
| ·论文主要研究工作 | 第24-27页 |
| ·论文研究内容 | 第24-25页 |
| ·论文组织结构 | 第25-27页 |
| ·本章小结 | 第27-28页 |
| 第二章 基于MapReduce的大数据处理研究综述 | 第28-44页 |
| ·引言 | 第28-29页 |
| ·数据处理架构 | 第29-33页 |
| ·并行数据库 | 第29-30页 |
| ·MapReduce | 第30-32页 |
| ·混合数据处理平台 | 第32-33页 |
| ·基于MapReduce的数据处理算法综述 | 第33-42页 |
| ·基于MapReduce的连接算法优化 | 第33-40页 |
| ·基于MapReduce的迭代优化算法 | 第40-41页 |
| ·MapReduce的调度算法综述 | 第41-42页 |
| ·本章小结 | 第42-44页 |
| 第三章 基于MapReduce的Maxdiff直方图建立算法 | 第44-60页 |
| ·引言 | 第44-45页 |
| ·背景及相关工作介绍 | 第45-47页 |
| ·直方图的定义 | 第45-47页 |
| ·直方图的相关工作介绍 | 第47页 |
| ·基于MapReduce的Maxdiff直方图的精确算法 | 第47-51页 |
| ·基于MapReduce的Maxdiff直方图的近似算法 | 第51-54页 |
| ·实验 | 第54-58页 |
| ·本章小结 | 第58-60页 |
| 第四章 基于BloomFilter的等值连接算法的设计与优化 | 第60-86页 |
| ·引言 | 第60-61页 |
| ·背景及相关工作介绍 | 第61-64页 |
| ·BloomFilter的背景及相关工作介绍 | 第61-63页 |
| ·基于MapReduce的等值连接背景及相关工作介绍 | 第63-64页 |
| ·基于MapReduce的BloomFilter建立算法 | 第64-69页 |
| ·算法描述 | 第64-68页 |
| ·实验与分析 | 第68-69页 |
| ·基于BloomFilter的等值连接算法 | 第69-76页 |
| ·两表等值连接算法 | 第70-75页 |
| ·多表等值连接算法 | 第75-76页 |
| ·基于BloomFilter的连接算法代价模型 | 第76-82页 |
| ·BloomFilter建立的代价模型 | 第77-78页 |
| ·两表等值连接的代价模型 | 第78-80页 |
| ·多表等值连接的代价模型 | 第80-81页 |
| ·模型验证 | 第81-82页 |
| ·本章小结 | 第82-86页 |
| 第五章 数据倾斜的连接算法的设计与优化 | 第86-106页 |
| ·引言 | 第86-87页 |
| ·相关工作介绍 | 第87-88页 |
| ·两表数据倾斜的等值连接算法 | 第88-92页 |
| ·算法设计 | 第89-91页 |
| ·与range partition分区方法对比 | 第91-92页 |
| ·多表数据倾斜的等值连接算法优化 | 第92-95页 |
| ·算法设计 | 第93-94页 |
| ·数据分区 | 第94-95页 |
| ·算法整体描述 | 第95页 |
| ·与多表等值连接算法做对比 | 第95页 |
| ·实验 | 第95-100页 |
| ·两表数据倾斜的实验和实验分析 | 第95-100页 |
| ·多表数据倾斜的实验和实验分析 | 第100页 |
| ·本章小结 | 第100-106页 |
| 第六章 任意连接算法的设计与优化 | 第106-126页 |
| ·引言 | 第106-107页 |
| ·相关工作介绍 | 第107页 |
| ·Strict-Even-Join的算法设计 | 第107-116页 |
| ·算法设计 | 第108-112页 |
| ·数据分区 | 第112页 |
| ·完整算法描述 | 第112-113页 |
| ·数据集倾斜时的分析 | 第113页 |
| ·与1-Bucket-Theta算法对比 | 第113-114页 |
| ·与多表等值连接算法对比 | 第114-116页 |
| ·基于MapReduce多表任意连接算法优化 | 第116-118页 |
| ·算法描述 | 第116-117页 |
| ·MapReduce的并发控制 | 第117-118页 |
| ·基于MapReduce的任意连接的代价模型 | 第118-121页 |
| ·任意连接的代价模型 | 第119-120页 |
| ·等值连接的代价模型 | 第120-121页 |
| ·实验 | 第121-123页 |
| ·一轮MapReduce任意连接算法实验 | 第121-122页 |
| ·优化多表任意连接实验 | 第122-123页 |
| ·本章小结 | 第123-126页 |
| 第七章 总结与展望 | 第126-130页 |
| ·本文工作总结 | 第126-127页 |
| ·贡献及创新点 | 第127-128页 |
| ·进一步的工作 | 第128-130页 |
| 参考文献 | 第130-138页 |
| 致谢 | 第138-140页 |
| 在读期间发表的学术论文与取得的研究成果 | 第140-142页 |
| 攻读博士学位期间参加的科研项目 | 第142页 |
| 攻读博士学位期间获得的奖励 | 第142页 |