首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

分布式环境下的数据挖掘算法的实现与应用研究

摘要第5-6页
Abstract第6页
第1章 绪论第9-14页
    1.1 研究背景及意义第9-10页
    1.2 国内外研究现状第10-12页
        1.2.1 关联规则算法相关研究概述第10-11页
        1.2.2 聚类分析相关研究概述第11-12页
    1.3 论文主要工作第12-13页
    1.4 论文组织结构第13-14页
第2章 分布式平台技术概述第14-17页
    2.1 虚拟化技术概述第14页
    2.2 分布式平台概述第14-16页
        2.2.1 Hadoop平台概述第14-15页
        2.2.2 Spark平台概述第15-16页
    2.3 本章小结第16-17页
第3章 分布式的最大频繁项算法研究第17-33页
    3.1 关联规则算法第17-20页
        3.1.1 关联规则相关定义第17-18页
        3.1.2 Apriori算法与FP-Growth算法第18-19页
        3.1.3 现有算法存在的问题第19-20页
    3.2 改进的分布式SMFI算法第20-29页
        3.2.1 数据集划分投影第21-22页
        3.2.2 频繁项树的深度路径搜索第22-24页
        3.2.3 长度优先的超集检验第24-26页
        3.2.4 降维策略第26-27页
        3.2.5 SMFI算法描述第27-29页
    3.3 实验结果与分析第29-32页
        3.3.1 实验环境第29-30页
        3.3.2 实验数据和结果第30-32页
    3.4 本章小结第32-33页
第4章 分布式的密度聚类算法研究第33-54页
    4.1 DBSCAN算法分析与概述第33-38页
        4.1.1 相关定义概述第33-36页
        4.1.2 DBSCAN算法流程第36页
        4.1.3 DBSCAN算法存在的问题第36-37页
        4.1.4 G-DBSCAN算法存在的问题第37-38页
    4.2 相关改进策略第38-48页
        4.2.1 基于分组的无重叠聚类策略第38-42页
        4.2.2 分区内的组合并第42-45页
        4.2.3 分区间的类合并第45-48页
    4.3 基于Spark的分布式SPDBSCAN算法描述第48-49页
        4.3.1 SPDBSCAN算法描述第48页
        4.3.2 算法复杂度分析第48-49页
    4.4 实验结果与分析第49-52页
        4.4.1 性能指标第49-50页
        4.4.2 数据集的选取与划分第50页
        4.4.3 实验环境第50页
        4.4.4 实验结果的比较与分析第50-52页
    4.5 本章小结第52-54页
第5章 结论与展望第54-56页
    5.1 本文工作总结第54-55页
    5.2 不足与展望第55-56页
参考文献第56-60页
攻读硕士期间学位期间发表的论文及其它成果第60-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:基于属性测度理论的架空线路工程评估研究
下一篇:聚光式PV/T热电联供系统的优化设计及性能分析