首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于SPARK的海量数据频繁模式挖掘算法研究

摘要第4-5页
ABSTRACT第5页
第1章 绪论第8-17页
    1.1 课题背景及研究的目的和意义第8-9页
    1.2 相关理论的发展概况第9-15页
        1.2.1 频繁项集挖掘第9-11页
        1.2.2 时间序列压缩第11-13页
        1.2.3 分布式计算框架Spark第13-15页
    1.3 本文的主要研究内容第15-17页
第2章 基于SPARK的频繁项集挖掘算法第17-42页
    2.1 引言第17页
    2.2 SPARK上的并行APRIORI挖掘算法第17-22页
        2.2.1 算法过程第19-21页
        2.2.2 算法优化第21-22页
    2.3 SPARK上的并行FP-GROWTH挖掘算法第22-29页
        2.3.1 算法过程第24-28页
        2.3.2 算法优化第28-29页
    2.4 SPARK上的两段式挖掘算法第29-40页
        2.4.1 算法过程第29-36页
        2.4.2 算法的完备性第36-37页
        2.4.3 算法优化第37-40页
    2.5 三种算法的比较第40-41页
    2.6 基于SPARK的频繁子序列挖掘第41页
    2.7 本章小结第41-42页
第3章 基于感知重要点的时间序列压缩算法第42-53页
    3.1 引言第42页
    3.2 时间序列上数据点的感知重要性第42-45页
    3.3 基于感知重要点压缩时间序列第45-50页
        3.3.1 基于全局感知重要点的压缩算法第45-48页
        3.3.2 基于局部感知重要点的压缩算法第48-50页
    3.4 两种算法的对比第50-51页
    3.5 基于SPARK平台的压缩第51页
    3.6 在压缩的时间序列上寻找频繁模式第51-52页
    3.7 本章小结第52-53页
第4章 实验结果与分析第53-65页
    4.1 引言第53页
    4.2 基于SPARK的频繁项集挖掘算法实验第53-58页
        4.2.1 实验环境与实验数据第53-54页
        4.2.2 实验结果与分析第54-58页
    4.3 基于感知重要点的时间序列压缩算法实验第58-63页
        4.3.1 实验环境和实验数据第58页
        4.3.2 实验结果与分析第58-63页
    4.4 本章小结第63-65页
结论第65-66页
参考文献第66-70页
攻读硕士学位期间发表的论文及其它成果第70-72页
致谢第72页

论文共72页,点击 下载论文
上一篇:马克思生态思想视域下的我国生态文明建设研究
下一篇:毛泽东对马克思主义廉政思想的贡献研究