首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Spark大表等值连接的优化及其在网络流量数据分析的应用研究

摘要第5-6页
Abstract第6页
第一章 引言第9-15页
    1.1 研究背景第9-11页
    1.2 研究现状第11-13页
    1.3 本文贡献第13页
    1.4 论文组织结构第13-14页
    1.5 本章小结第14-15页
第二章 相关技术介绍第15-23页
    2.1 HDFS介绍第15-18页
        2.1.1 HDFS系统架构第15-16页
        2.1.2 HDFS关键问题第16-18页
    2.2 Spark介绍第18-21页
        2.2.1 Spark设计思想第18-19页
        2.2.2 Spark生态系统介绍第19-20页
        2.2.3 Spark Join实例分析第20-21页
    2.3 BloomFilter原理第21-22页
    2.4 本章小结第22-23页
第三章 基于BloomFilter的Spark大表关联的优化第23-34页
    3.1 问题描述第23-24页
    3.2 算法描述与实现第24-29页
        3.2.1 算法架构第24-26页
        3.2.2 位数组生成第26-28页
        3.2.3 数据表过滤与连接第28-29页
    3.3 算法分析第29-33页
        3.3.1 代价分析第29-32页
        3.3.2 适用场景分析第32-33页
    3.4 本章小结第33-34页
第四章Spark计算框架在网络流量数据分析的应用研究第34-43页
    4.1 当前流量分析系统的缺陷第34-35页
    4.2 Spark在NetFlow大数据处理的可行性分析第35-36页
    4.3 基于Spark的网络流量分析系统架构第36-37页
    4.4 分布式存储层设计第37-38页
    4.5 分布式计算层设计第38-42页
        4.5.1 网络流量分析系统需求第38-39页
        4.5.2 NetFlow批量数据处理设计第39-41页
        4.5.3 NetFlow流式数据处理设计第41-42页
    4.6 本章小结第42-43页
第五章 实验与评价第43-50页
    5.1 实验方法与目的第43页
    5.2 实验环境第43-45页
        5.2.1 实验配置第43-44页
        5.2.2 实验数据第44-45页
    5.3 实验任务第45页
    5.4 实验结果与分析第45-49页
        5.4.1 实验一:Spark大表等值连接优化实验第45-48页
        5.4.2 实验二:Spark与Mapreduce性能对比实验第48-49页
    5.5 本章小结第49-50页
第六章 总结与展望第50-52页
    6.1 本文总结第50页
    6.2 展望第50-52页
参考文献第52-54页
攻读硕士学位期间取得的研究成果第54-55页
致谢第55-56页
附件第56页

论文共56页,点击 下载论文
上一篇:媒介融合语境下的纸媒官方微信传播研究
下一篇:基于度量学习和稀疏表示的行人重识别技术研究