首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的大数据挖掘技术的研究与实现

摘要第8-10页
Abstract第10-11页
第一章 绪论第12-19页
    1.1 研究背景第12-13页
    1.2 国内外研究现状第13-16页
    1.3 研究内容第16-17页
    1.4 主要贡献第17-18页
    1.5 本文的组织结构第18-19页
第二章 Spark系统生态与环境搭建第19-31页
    2.1 Spark大数据处理框架及其生态系统第19-24页
        2.1.1 Spark Runtime第19-21页
        2.1.2 Spark SQL第21页
        2.1.3 MLlib第21-22页
        2.1.4 GraphX第22-23页
        2.1.5 Spark Streaming第23-24页
    2.2 Scala语言第24-25页
    2.3 Spark开发环境及其分布式集群搭建第25-31页
        2.3.1 硬件系统要求第25-26页
        2.3.2 构造分布式Hadoop集群第26-27页
        2.3.3 构造分布式Spark集群第27-28页
        2.3.4 配置Spark的IDE开发环境第28-31页
第三章 基于Spark的分布式协同过滤推荐实现第31-47页
    3.1 MLlib第31-32页
        3.1.1 MLlib算法库第31-32页
    3.2 协同过滤算法第32-35页
        3.2.1 协同过滤综述第32页
        3.2.2 协同过滤核心思想第32-35页
    3.3 基于Spark的协同过滤推荐实现第35-39页
        3.3.1 MLlib中并行协同过滤推荐的实现第35-36页
        3.3.2 核心代码第36-39页
    3.4 实验验证第39-47页
        3.4.1 选用的数据集第39-41页
        3.4.2 运行结果第41-44页
        3.4.3 使用分布式协同过巧进行推荐第44-47页
第四章 基于Spark的Apriori算法分布式实现第47-62页
    4.1 Apriori算法原理和分析第47-52页
        4.1.1 Apriori算法概念和核心步骤第47-48页
        4.1.2 Apriori算法的伪代码实现第48-49页
        4.1.3 Apriori算法单机实现的核心代码第49-52页
    4.2 Apriori算法基于Spark的分布式实现第52-56页
        4.2.1 并行Apriori算法实现思路第52页
        4.2.2 并行Apriori算法核心步骤第52-56页
    4.3 实验验证第56-62页
        4.3.1 实验环境和条件第56-58页
        4.3.2 实验结果分析第58-62页
第五章 总结与展望第62-64页
参考文献第64-66页
致谢第66-67页
附件第67页

论文共67页,点击 下载论文
上一篇:网球初学者双手同时学习的实验研究
下一篇:分裂导线振动模态的传递矩阵方法