基于Hadoop的多表连接操作查询优化关键技术研究

摘要	第4-5页
ABSTRACT	第5页
第1章绪论	第9-13页
1.1 课题来源和背景及研究意义	第9-10页
1.1.1 课题来源	第9页
1.1.2 课题背景及研究意义	第9-10页
1.2 国内外研究现状	第10-11页
1.3 本文的主要研究内容	第11-12页
1.4 本文的组织结构	第12-13页
第2章 MAP-REDUCE与MAP-REDUCE连接算法	第13-23页
2.1 引言	第13页
2.2 HADOOP基本架构	第13-14页
2.3 MAP-REDUCE框架	第14-17页
2.3.1 Map-Reduce框架执行流程	第14-16页
2.3.2 Map-Reduce框架工作原理	第16-17页
2.4 MAP-REDUCE连接算法	第17-22页
2.4.1 Reduce端连接算法	第18-19页
2.4.2 Map端连接算法	第19-20页
2.4.3 半连接算法	第20页
2.4.4 两两连接法	第20-21页
2.4.5 Replicated Join法	第21-22页
2.4.6 分组连接法	第22页
2.5 本章小结	第22-23页
第3章基于两两连接法的多表连接执行方法	第23-40页
3.1 引言	第23页
3.2 优化的执行策略	第23-24页
3.3 两两连接法的寻优算法	第24-31页
3.3.1 连接关系图	第25-26页
3.3.2 多表连接关系编号	第26-29页
3.3.3 两表连接结果的大小估计	第29-31页
3.4 基于蚁群算法的多表连接执行计划	第31-38页
3.4.1 蚁群算法的原理	第31页
3.4.2 蚁群算法的数学模型	第31-33页
3.4.3 蚁群算法中的代价计算	第33-35页
3.4.4 蚁群算法实现	第35-37页
3.4.5 蚁群算法的收敛性和时间复杂度	第37-38页
3.5 本章小结	第38-40页
第4章基于TRMJ法的多表连接执行方法	第40-60页
4.1 引言	第40页
4.2 二叉连接执行树建立	第40-47页
4.2.1 连接图划分算法	第41-43页
4.2.2 连接执行树生成策略	第43-44页
4.2.3 连接执行树生成实现	第44-47页
4.3 REPLICATED JOIN法覆盖范围的确定	第47-57页
4.3.1 覆盖范围算法的执行策略	第47-50页
4.3.2 覆盖范围算法的实现	第50-54页
4.3.3 改进的Replicated Join法	第54-57页
4.4 MAP-REDUCE算法代价估计	第57-59页
4.5 本章小结	第59-60页
第5章实验及结果分析	第60-67页
5.1 引言	第60页
5.2 实验环境	第60页
5.3 实验和结果分析	第60-66页
5.3.1 执行效率对比	第60-63页
5.3.2 执行计划时间对比	第63-66页
5.3.3 估计代价与运行时间对比	第66页
5.4 本章小结	第66-67页
结论	第67-68页
参考文献	第68-72页
攻读硕士学位期间发表的论文及其它成果	第72-74页
致谢	第74页