首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的海量数据分析与性能优化

摘要第5-6页
ABSTRACT第6页
第一章 绪论第10-14页
    1.1 研究背景及意义第10-11页
    1.2 研究内容第11-12页
    1.3 论文结构第12-14页
第二章 大数据平台和Spark计算框架第14-29页
    2.1 Hadoop简介第14-20页
        2.1.1 海量网络流量环境特点及面对的挑战第14-15页
        2.1.2 Hadoop概述第15-16页
        2.1.3 计算模型MapReduce第16-18页
        2.1.4 分布式文件系统HDFS第18-20页
    2.2 Spark计算框架第20-28页
        2.2.1 Spark概述第20-21页
        2.2.2 Spark架构第21-23页
        2.2.3 Spark核心概念第23-25页
        2.2.4 Spark作业执行流程第25-26页
        2.2.5 Shuffle第26-28页
    2.3 Web缓存第28页
    2.4 本章小结第28-29页
第三章 海量网络流量分析第29-35页
    3.1 网络流量采集与解析系统第29-30页
    3.2 数据导入系统第30页
    3.3 网络流量分析第30-33页
        3.3.1 用户访问次数分析第31页
        3.3.2 用户下行流量分析第31-32页
        3.3.3 URL访问次数分析第32-33页
        3.3.4 URL下行流量分析第33页
    3.4 本章小节第33-35页
第四章 海量网络数据分析优化与实现第35-52页
    4.1 算子的选择第35-39页
    4.2 数据本地性第39-41页
    4.3 持久化第41-47页
    4.4 并行度第47-50页
    4.5 本章小结第50-52页
第五章 基于Spark的Join操作的优化与实现第52-60页
    5.1 Join操作第52-54页
    5.2 Join的优化实现和分析第54-59页
    5.3 本章小结第59-60页
第六章 总结与展望第60-61页
参考文献第61-63页
致谢第63-64页
攻读学位期间发表的学术论文目录第64页

论文共64页,点击 下载论文
上一篇:基于手机视频的三维人脸重建算法的研究与实现
下一篇:车联网多播路由与视频传输的研究