首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

分布式关联规则挖掘算法的研究

摘要第3-4页
abstract第4-5页
1 绪论第8-18页
    1.1 课题背景与意义第8-9页
    1.2 国内外研究现状第9-15页
        1.2.1 数据挖掘研究现状第9-11页
        1.2.2 Apriori算法研究现状第11-15页
    1.3 本文的研究意义及主要工作第15页
    1.4 本文的组织结构第15-16页
    1.5 本章小节第16-18页
2 Apriori算法的MapReduce并行化研究第18-34页
    2.1 Apriori算法第18-21页
        2.1.1 Apriori算法基本思想第19-20页
        2.1.2 Apriori算法实现第20-21页
    2.2 AprioriMR算法第21-24页
        2.2.1 AprioriMR算法基本思想第22-23页
        2.2.2 AprioriMR算法实现第23-24页
        2.2.3 AprioriMR算法分析第24页
    2.3 hadoop分布式平台第24-31页
        2.3.1 Hadoop技术背景第24-26页
        2.3.2 分布式文件系统HDFS第26-28页
        2.3.3 MapReduce编程模型第28-30页
        2.3.4 Hadoop数据库HBase第30-31页
    2.4 基于Hadoop的数据挖掘系统的分析与设计第31-33页
        2.4.1 数据挖掘概述第31页
        2.4.2 基于Hadoop的数据挖掘系统第31-33页
    2.5 本章小结第33-34页
3 基于加权项集的并行Apriori算法第34-48页
    3.1 算法的思想第34-39页
        3.1.1 数据预处理第35-36页
        3.1.2 数据分块第36-37页
        3.1.3 局部剪枝第37-38页
        3.1.4 全局剪枝第38页
        3.1.5 关联规则生成第38-39页
    3.2 算法的流程第39-40页
    3.3 算法的实现第40-45页
        3.3.1 数据预处理第41-42页
        3.3.2 数据分块第42-43页
        3.3.3 局部频繁项集的生成第43页
        3.3.4 全局频繁项集的生成第43-45页
    3.4 算法的性能分析第45-46页
    3.5 本章小结第46-48页
4 实验环境介绍及实验结果分析第48-59页
    4.1 实验环境设计第48页
    4.2 集群实验环境的搭建第48-52页
    4.3 实验中MapReduce的数据流程第52-53页
    4.4 实验数据来源说明第53页
    4.5 实验结果及不同算法的对比第53-57页
        4.5.1 算法的有效性验证第54页
        4.5.2 算法的支持度值设定实验第54-55页
        4.5.3 不同节点下算法的运行时间实验第55-56页
        4.5.4 不同支持度下算法的运行时间实验第56-57页
        4.5.5 不同数据量下算法的运行时间实验第57页
    4.6 本章小结第57-59页
5 总结与展望第59-61页
    5.1 总结第59页
    5.2 展望第59-61页
致谢第61-63页
参考文献第63-66页

论文共66页,点击 下载论文
上一篇:医院检验结果互认信息系统设计与实现
下一篇:面向用户兴趣的协同过滤算法研究