首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark Streaming的数据流序列模式挖掘算法的研究与实现

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-16页
    1.1 研究背景和选题意义第10-11页
    1.2 国内外研究现状第11-13页
    1.3 研究内容第13-14页
    1.4 论文组织结构第14-16页
第二章 序列模式挖掘算法研究概述第16-23页
    2.1 序列模式挖掘概念第16页
    2.2 基本术语第16-18页
    2.3 序列模式挖掘经典算法第18-22页
        2.3.1 AprioriAll算法第18-19页
        2.3.2 GSP算法第19-20页
        2.3.3 FreeSpan算法第20-21页
        2.3.4 PrefixSpan算法第21-22页
    2.4 本章小结第22-23页
第三章 Spark Streaming流式计算框架及相关环境第23-33页
    3.1 Spark内存计算第23-30页
        3.1.1 Spark概述第23-24页
        3.1.2 Spark特点第24页
        3.1.3 弹性分布式数据集第24-27页
        3.1.4 Spark核心原理第27-30页
    3.2 Spark Streaming流式计算第30-31页
    3.3 应用程序开发环境第31-32页
        3.3.1 Scala语言简介第31-32页
        3.3.2 Intellij Idea开发环境配置第32页
    3.4 本章小结第32-33页
第四章 基于滑动窗口的数据流序列模式挖掘算法第33-51页
    4.1 引言第33页
    4.2 数据流场景分析第33-36页
        4.2.1 数据流特点第34页
        4.2.2 数据流挖掘的要求第34-35页
        4.2.3 数据流序列模式挖掘和传统的序列模式挖掘区别第35-36页
    4.3 相关概念和定义第36-37页
    4.4 数据结构设计第37-40页
        4.4.1 CompressTrie第37-39页
        4.4.2 PatternCache第39-40页
    4.5 算法描述第40-45页
        4.5.1 算法流程第41-42页
        4.5.2 算法伪代码第42-43页
        4.5.3 算法实例第43-45页
    4.6 算法实验结果与分析第45-50页
        4.6.1 实验环境和数据集第45页
        4.6.2 召回率(Recall)分析第45-48页
        4.6.3 内存消耗分析第48-49页
        4.6.4 CPU占有率分析第49-50页
    4.7 本章小结第50-51页
第五章 基于Spark Streaming的数据流序列模式挖掘算法第51-65页
    5.1 引言第51页
    5.2 相关概念和定义第51-53页
    5.3 算法描述第53-59页
        5.3.1 算法过程第53-57页
        5.3.2 算法并行化思路第57-58页
        5.3.3 算法滑动窗口设计第58页
        5.3.4 算法伪代码第58-59页
    5.4 算法实验结果与分析第59-64页
        5.5.1 召回率(Recall)分析第60-61页
        5.5.2 集群和单机性能比较第61-63页
        5.5.3 最小支持度对运行时间影响第63-64页
    5.5 本章小结第64-65页
第六章 总结与展望第65-67页
    6.1 工作总结第65-66页
    6.2 未来展望第66-67页
参考文献第67-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:基于Petri网的多流程形式化表示与验证的研究与实现
下一篇:基于微信的电商平台通用客户端的设计与实现