首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于脚本语言的网络流量分析与优化

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第10-14页
    1.1 研究背景第10-11页
    1.2 研究意义第11-12页
    1.3 论文结构第12-14页
第二章 网络流量分析现状第14-19页
    2.1 网络流量分析方法第14-15页
        2.1.1 单机分析网络流量第14页
        2.1.2 分布式系统分析网络流量第14-15页
    2.2 分布式系统网络流量分析框架第15-17页
    2.3 分布式系统网络流量分析中存在的问题第17-18页
    2.4 本章小结第18-19页
第三章 Hive与Pig架构对比和性能优化第19-35页
    3.1 MapReduce计算框架介绍第19-20页
    3.2 Hive与Pig架构分析与对比第20-22页
    3.3 Hive与Pig性能优化分析第22-34页
        3.3.1 合并小文件优化第22-25页
        3.3.2 中间结果输出压缩第25-27页
        3.3.3 Join优化策略第27-34页
    3.4 本章小结第34-35页
第四章 Spark SQL性能优化第35-46页
    4.1 Spark综述第35-38页
        4.1.1 Spark计算模型第35-36页
        4.1.2 Spark系统架构第36-37页
        4.1.3 Spark对比MapReduce的优势第37-38页
    4.2 Spark SQL介绍第38-39页
    4.3 Spark SQL性能优化第39-44页
        4.3.1 在Spark SQL中使用Cache第39-41页
        4.3.2 StorageLevel对Spark SQL的性能影响第41-43页
        4.3.3 数据序列化的优化第43-44页
    4.4 本章小结第44-46页
第五章 RCFile与Parquet文件格式对比第46-54页
    5.1 分布式存储与网络流量分析优化第46-47页
    5.2 Sequence File第47-48页
    5.3 RCFile文件格式第48-49页
    5.4 Parquet文件格式第49-50页
    5.5 各文件格式进行对比第50-53页
        5.5.1 几种存储文件大小的比较与分析第50-52页
        5.5.2 文件格式与压缩第52-53页
    5.6 本章小结第53-54页
第六章 Hive SQL,Impala与Spark SQL性能对比第54-69页
    6.1 综述第54-57页
    6.2 文件格式影响查询速度第57-60页
        6.2.1 压缩对于查询速度的影响第58-59页
        6.2.2 文件格式影响查询时间(忽略压缩问题)第59-60页
    6.3 文件格式对于CPU和内存的影响第60-64页
        6.3.1 文件格式对于CPU的影响第60-63页
        6.3.2 文件格式对于内存的影响第63-64页
    6.4 不同查询工具生成Parquet格式对Impala查询的影响第64-67页
        6.4.1 三种Parquet格式的CPU累积时间对比第64-65页
        6.4.2 三种Parquet格式的内存消耗对比第65-66页
        6.4.3 三种Parquet格式的加载数据量对比第66-67页
    6.5 结论第67页
    6.6 本章小结第67-69页
第七章 总结与展望第69-72页
参考文献第72-75页
致谢第75-76页
攻读学位期间发表的学术论文目录第76页

论文共76页,点击 下载论文
上一篇:基于NFV网络资源安全防护技术研究
下一篇:面向用户体验的OTT视频流业务质量评估方法