首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的分布式关联规则算法研究

摘要第5-6页
abstract第6-7页
第1章 绪论第10-16页
    1.1 研究背景及意义第10-11页
    1.2 国内外现状第11-14页
    1.3 主要研究内容第14页
    1.4 论文大致结构第14-16页
第2章 相关知识及技术第16-32页
    2.1 引言第16页
    2.2 关联规则相关概念第16-18页
        2.2.1 关联规则的引入第16-17页
        2.2.2 关联规则的概念第17-18页
        2.2.3 关联规则算法第18页
    2.3 APRIORI算法第18-20页
        2.3.1 Apriori算法的主要思路第18-19页
        2.3.2 Apriori算法举例第19-20页
    2.4 FP-TREE算法第20-24页
        2.4.1 FP-tree算法的主要思路第20-21页
        2.4.2 FP-tree算法的描述第21-22页
        2.4.3 FP-tree算法举例第22-24页
    2.5 分布式计算环境相关概念第24-30页
        2.5.1 基于Hadoop的分布式计算环境第25-26页
        2.5.2 Spark分布式计算环境的引入第26页
        2.5.3 Spark分布式计算环境的分类第26-28页
        2.5.4 弹性分布式数据集(RDD)第28-30页
    2.6 本章小结第30-32页
第3章 基于SPARK的算法分析与优化第32-46页
    3.1 引言第32-33页
    3.2 基于SPARK的算法分析与比较第33-35页
        3.2.1 基于Spark的Apriori算法分析第33-34页
        3.2.2 基于Spark的FP-tree算法和CSFP-tree算法的比较分析第34-35页
    3.3 基于SPARK的算法优化与模型构建第35-44页
        3.3.1 CSFP-tree算法的主旨思想第35页
        3.3.2 CSFP-tree算法的描述第35-36页
        3.3.3 CSFP-tree算法的构建第36-38页
        3.3.4 基于Spark的CSFP-tree算法的提出目的第38-39页
        3.3.5 基于Spark的CSFP-tree算法的具体流程第39-41页
        3.3.6 均衡分组的策略第41-43页
        3.3.7 基于Spark的CSFP-tree算法的描述第43-44页
    3.4 本章小结第44-46页
第4章 基于SPARK的CSFP-TREE算法实现与分析第46-53页
    4.1 引言第46页
    4.2 实验环境以及数据集的选取第46-48页
        4.2.1 硬件环境第46-47页
        4.2.2 软件环境第47-48页
        4.2.3 实验数据集及评价标准第48页
    4.3 基于SPARK的CSFP-TREE算法实验及分析第48-51页
        4.3.1 实验 1第48-49页
        4.3.2 实验 2第49-51页
    4.4 本章小结第51-53页
结论第53-55页
参考文献第55-59页
攻读硕士学位期间发表的论文和取得的科研成果第59-61页
致谢第61-62页

论文共62页,点击 下载论文
上一篇:地市供电企业政工管理系统的设计与实现
下一篇:基于密度的局部嵌入降维算法研究