首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的多表连接操作查询优化关键技术研究

摘要第4-5页
ABSTRACT第5页
第1章 绪论第9-13页
    1.1 课题来源和背景及研究意义第9-10页
        1.1.1 课题来源第9页
        1.1.2 课题背景及研究意义第9-10页
    1.2 国内外研究现状第10-11页
    1.3 本文的主要研究内容第11-12页
    1.4 本文的组织结构第12-13页
第2章 MAP-REDUCE与MAP-REDUCE连接算法第13-23页
    2.1 引言第13页
    2.2 HADOOP基本架构第13-14页
    2.3 MAP-REDUCE框架第14-17页
        2.3.1 Map-Reduce框架执行流程第14-16页
        2.3.2 Map-Reduce框架工作原理第16-17页
    2.4 MAP-REDUCE连接算法第17-22页
        2.4.1 Reduce端连接算法第18-19页
        2.4.2 Map端连接算法第19-20页
        2.4.3 半连接算法第20页
        2.4.4 两两连接法第20-21页
        2.4.5 Replicated Join法第21-22页
        2.4.6 分组连接法第22页
    2.5 本章小结第22-23页
第3章 基于两两连接法的多表连接执行方法第23-40页
    3.1 引言第23页
    3.2 优化的执行策略第23-24页
    3.3 两两连接法的寻优算法第24-31页
        3.3.1 连接关系图第25-26页
        3.3.2 多表连接关系编号第26-29页
        3.3.3 两表连接结果的大小估计第29-31页
    3.4 基于蚁群算法的多表连接执行计划第31-38页
        3.4.1 蚁群算法的原理第31页
        3.4.2 蚁群算法的数学模型第31-33页
        3.4.3 蚁群算法中的代价计算第33-35页
        3.4.4 蚁群算法实现第35-37页
        3.4.5 蚁群算法的收敛性和时间复杂度第37-38页
    3.5 本章小结第38-40页
第4章 基于TRMJ法的多表连接执行方法第40-60页
    4.1 引言第40页
    4.2 二叉连接执行树建立第40-47页
        4.2.1 连接图划分算法第41-43页
        4.2.2 连接执行树生成策略第43-44页
        4.2.3 连接执行树生成实现第44-47页
    4.3 REPLICATED JOIN法覆盖范围的确定第47-57页
        4.3.1 覆盖范围算法的执行策略第47-50页
        4.3.2 覆盖范围算法的实现第50-54页
        4.3.3 改进的Replicated Join法第54-57页
    4.4 MAP-REDUCE算法代价估计第57-59页
    4.5 本章小结第59-60页
第5章 实验及结果分析第60-67页
    5.1 引言第60页
    5.2 实验环境第60页
    5.3 实验和结果分析第60-66页
        5.3.1 执行效率对比第60-63页
        5.3.2 执行计划时间对比第63-66页
        5.3.3 估计代价与运行时间对比第66页
    5.4 本章小结第66-67页
结论第67-68页
参考文献第68-72页
攻读硕士学位期间发表的论文及其它成果第72-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:普通菜豆14-3-3蛋白基因PvGF14n/d在非生物胁迫中的功能分析
下一篇:大学生政治信仰教育研究