首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

连接操作在Spark框架上的实现与优化

摘要第9-10页
ABSTRACT第10页
第一章 绪论第11-17页
    1.1 引言第11-13页
    1.2 研究现状与进展第13-15页
    1.3 本文的主要研究内容及成果第15-16页
    1.4 论文结构第16-17页
第二章 相关知识第17-32页
    2.1 Hadoop简介第17-22页
        2.1.1 MapReduce编程模型第17-18页
        2.1.2 Hadoop的MapReduce第18-20页
        2.1.3 GFS第20-21页
        2.1.4 HDFS第21-22页
    2.2 Hive简介第22-26页
        2.2.1 Hive架构第22-23页
        2.2.2 数据类型和文件格式第23-25页
        2.2.3 HiveQL第25-26页
    2.3 高速计算引擎Spark第26-31页
        2.3.1 Spark简介第26-27页
        2.3.2 弹性分布式数据集RDD第27-29页
        2.3.3 集群运行模式第29-30页
        2.3.4 Job调度与容错处理第30-31页
    2.4 本章小结第31-32页
第三章 Spark SQL第32-43页
    3.1 Spark SQL简介第32-33页
    3.2 SQL/HQL的执行流程第33-38页
    3.3 JOIN优化规则第38-39页
        3.3.1 JOIN简介第38页
        3.3.2 JOIN优化规则第38-39页
    3.4 JOIN算法第39-42页
        3.4.1 连接算法简介第39-40页
        3.4.2 JOIN算法选择策略第40-41页
        3.4.3 左半连接算法第41页
        3.4.4 内连接算法第41-42页
        3.4.5 外连接算法第42页
    3.5 本章小结第42-43页
第四章 JOIN操作实现与优化第43-56页
    4.1 SelectedBroadcastHashOuterJoin算法第43-46页
        4.1.1 算法思想第43页
        4.1.2 算法描述第43-44页
        4.1.3 算法实现第44-46页
    4.2 SortMergeOuterJoin策略第46-49页
        4.2.1 算法思想第46页
        4.2.2 算法描述第46-48页
        4.2.3 算法实现第48-49页
    4.3 基于广播操作小表数据去重优化第49-50页
        4.3.1 问题描述第49页
        4.3.2 优化思想第49-50页
        4.3.3 优化实现第50页
    4.4 基于Bloom Filter过滤的大表等值连接优化第50-55页
        4.4.1 问题描述第50-51页
        4.4.2 海量数据去重算法BloomFilter第51-55页
    4.5 本章小结第55-56页
第五章 实验测试与分析第56-67页
    5.1 实验集群搭建第56-62页
        5.1.1 通用软件环境配置第57-58页
        5.1.2 Hadoop集群配置第58-59页
        5.1.3 Hive安装第59-61页
        5.1.4 Spark集群搭建第61页
        5.1.5 数据说明第61-62页
    5.2 SelectedBroadcastHashOuterJoin测试第62-63页
        5.2.1 实验数据集第62页
        5.2.2 测试结果第62-63页
    5.3 SortMergeOuterJoin测试第63-64页
        5.3.1 实验数据集第63页
        5.3.2 测试结果第63-64页
    5.4 小表去重优化测试第64-65页
        5.4.1 实验数据集第64页
        5.4.2 测试结果第64-65页
    5.5 基于Bloom Filter的大表等值连接优化第65-66页
        5.5.1 实验数据集第65-66页
        5.5.2 测试结果第66页
    5.6 本章小结第66-67页
第六章 总结与展望第67-69页
    6.1 本文主要内容总结第67页
    6.2 未来工作展望第67-69页
致谢第69-70页
参考文献第70-73页
作者在学期间取得的学术成果第73页

论文共73页,点击 下载论文
上一篇:企业合同管理信息系统的设计与实现
下一篇:软件自动修复技术修复内涵分析研究