首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

并行频繁项集挖掘算法研究

摘要第4-5页
abstract第5-6页
1第8-13页
    1.1 研究背景及意义第8-10页
        1.1.1 课题背景第8-9页
        1.1.2 研究意义第9-10页
    1.2 国内外研究现状第10-11页
        1.2.1 国外研究现状第10-11页
        1.2.2 国内研究现状第11页
    1.3 本文研究内容第11-12页
    1.4 本文的组织结构第12-13页
第2章 相关技术分析第13-20页
    2.1 Spark相关技术第13-15页
        2.1.1 Spark体系结构第13页
        2.1.2 Spark编程模型第13-14页
        2.1.3 Spark调度管理原理第14-15页
    2.2 频繁项集挖掘算法第15-20页
        2.2.1 单机挖掘算法第15-16页
        2.2.2 基于MPI的挖掘算法第16-18页
        2.2.3 基于MapReduce的挖掘算法第18页
        2.2.4 基于Spark的挖掘算法第18-20页
第3章 基于单机和单节点处理的频繁项集挖掘算法及改进第20-54页
    3.1 FP-Growth算法第20-31页
    3.2 Apriori算法及基于Apriori的二维表改进算法第31-38页
        3.2.1 Apriori算法设计概述第31-34页
        3.2.2 Apriori算法的二维表改进算法第34-35页
        3.2.3 实验结果和分析第35-38页
    3.3 DHP算法及基于单节点的DHP改进算法第38-54页
        3.3.1 DHP算法设计概述第38-44页
        3.3.2 基于Spark单节点的串行DHP压缩算法第44-47页
        3.3.3 实验结果和分析第47-54页
第4章 基于Spark集群的优化策略第54-70页
    4.1 Spark集群的DHP优化具体实现第54-62页
        4.1.1 建立哈希函数,生成集合数据第54页
        4.1.2 将集合中数据添加到Tuple2数据集中第54-56页
        4.1.3 压缩求和第56页
        4.1.4 剪枝过滤最小支持度第56-58页
        4.1.5 条件聚合数据集第58-60页
        4.1.6 实验结果和分析第60-62页
    4.2 Spark集群的FP-Growth优化第62-70页
        4.2.1 计算频繁1-项集第63-64页
        4.2.2 数据分组第64-65页
        4.2.3 并行挖掘频繁项集第65-66页
        4.2.4 数据聚合第66-67页
        4.2.5 实验结果和分析第67-70页
第5章 结论与展望第70-72页
    5.1 全文总结第70页
    5.2 展望第70-72页
参考文献第72-76页
致谢第76页

论文共76页,点击 下载论文
上一篇:数字化信息系统辅助中学物理实验教学中的应用研究
下一篇:利用新媒体教学改善高中生物理学习体验的实践研究