首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的分布式频繁项集挖掘算法研究

摘要第4-6页
ABSTRACT第6-7页
第一章 绪论第10-16页
    1.1 课题研究背景与意义第10-11页
    1.2 国内外研究现状第11-13页
        1.2.1 数据挖掘第12页
        1.2.2 频繁项集挖掘算法第12-13页
    1.3 研究的主要内容和创新点第13-14页
    1.4 论文的结构安排第14-16页
第二章 相关技术分析第16-28页
    2.1 Spark第16-19页
        2.1.1 Spark体系结构第16-17页
        2.1.2 Spark编程模型第17-18页
        2.1.3 Spark调度管理原理第18-19页
    2.2 频繁项集挖掘算法第19-27页
        2.2.1 单机挖掘算法第19-23页
        2.2.2 基于MPI的挖掘算法第23-25页
        2.2.3 基于MapReduce的挖掘算法第25-26页
        2.2.4 基于Spark的挖掘算法第26-27页
    2.3 本章小结第27-28页
第三章 基于Spark的分布式频繁项集挖掘算法第28-40页
    3.1 FP-growth算法第28-32页
    3.2 基于Spark的分布式频繁项集挖掘算法设计第32-38页
        3.2.1 DFPS算法设计概述第33页
        3.2.2 计算频繁 1-项集第33-34页
        3.2.3 条件模式基重分区第34-36页
        3.2.4 并行挖掘频繁项集第36-38页
    3.3 本章小结第38-40页
第四章 面向大规模Spark集群的DFPS优化策略第40-48页
    4.1 面向大规模Spark集群的DFPS优化策略概述第40-41页
    4.2 用户自定义优化策略第41-44页
    4.3 集群自适应优化策略第44-47页
    4.4 本章小结第47-48页
第五章 实验与分析第48-55页
    5.1 实验环境与数据集概述第48-49页
        5.1.1 试验环境第48页
        5.1.2 测试数据集第48-49页
    5.2 PFP算法和YAFIM算法第49-50页
        5.2.1 PFP算法概述第49页
        5.2.2 YAFIM算法概述第49-50页
    5.3 DFPS算法验证实验第50-54页
        5.3.1 速度性能分析实验第50-52页
        5.3.2 可伸缩性分析实验第52-53页
        5.3.3 实验结果分析第53-54页
    5.4 本章小结第54-55页
第六章 DFPS算法在项目中的应用第55-61页
    6.1 项目概述第55页
    6.2 项目实施第55-60页
        6.2.1 大数据平台设计第56-57页
        6.2.2 大数据平台搭建第57页
        6.2.3 集成HANA和R的环境第57-59页
        6.2.4 DFPS算法的应用第59-60页
    6.3 本章小结第60-61页
第七章 总结与展望第61-63页
    7.1 全文总结第61-62页
    7.2 展望第62-63页
参考文献第63-68页
攻读学位期间的研究成果目录第68-69页
致谢第69页

论文共69页,点击 下载论文
上一篇:泰安地区病死鸭胚中志贺氏菌分离鉴定及耐药性调查
下一篇:“隐乳净”对奶牛隐性乳房炎治疗效果的研究