首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的关联规则挖掘算法分析

摘要第5-6页
ABSTRACT第6页
第一章 绪论第9-12页
    1.1 研究背景第9页
    1.2 国内外研究状况第9-10页
    1.3 研究的内容第10-11页
    1.4 本论文的结构安排第11-12页
第二章 Hadoop技术与关联规则理论第12-30页
    2.1 Hadoop相关的基本概念第12-16页
        2.1.1 Hadoop的定义第12-13页
        2.1.2 Hadoop的优势第13页
        2.1.3 Hadoop的主要模块构成第13-15页
        2.1.4 Hadoop的拓扑结构第15-16页
    2.2 Hadoop的核心组件第16-19页
        2.2.1 分布式文件系统HDFS第16-18页
        2.2.2 并行计算架构Map Reduce第18-19页
    2.3 关联规则的相关概念第19-22页
        2.3.1 关联规则的常用术语第19-20页
        2.3.2 关联规则的挖掘过程第20-21页
        2.3.3 关联规则的相关算法第21-22页
    2.4 Aproiri算法实例描述第22-26页
        2.4.1 Apriori的算法描述第23-24页
        2.4.2 Apriori的算法举例第24-26页
    2.5 Fp-Growth算法实例描述第26-29页
        2.5.1 Fp-Growth算法的描述第26页
        2.5.2 Fp-Growth算法的举例第26-29页
    2.6 本章小结第29-30页
第三章 基于Hadoop的Apriori算法分析与改进第30-41页
    3.1 Apriori TMC算法的基本思想第30页
    3.2 Apriori TMC算法的描述第30-33页
    3.3 Apriori TMC算法的伪代码第33-34页
    3.4 Apriori TMC算法的实例分析第34-36页
    3.5 Apriori TMC算法的性能分析第36页
    3.6 Apriori TMC算法的并行策略第36-39页
    3.7 Apriori TMC算法的并行性能分析第39-40页
    3.8 本章小结第40-41页
第四章 基于Hadoop的Fp-Growth算法的分析与应用第41-49页
    4.1 基于Hadoop的Fp-Growth算法设计思想第41-42页
    4.2 搜索引擎的原理描述第42-43页
    4.3 基于关联规则的搜索引擎用户行为分析第43-45页
    4.4 关联规则在搜索引擎的应用场景设计第45-46页
        4.4.1 应用结构设计第45页
        4.4.2 数据流设计第45-46页
    4.5 关联规则在搜索引擎日志挖掘伪代码第46-48页
    4.6 本章小结第48-49页
第五章 实验设计与分析第49-56页
    5.1 实验环境建立第49-50页
    5.2 并行Apriori TMC算法的实验与分析第50-53页
        5.2.1 在单机条件下第50-51页
        5.2.2 多节点集群测试第51-53页
    5.3 并行Fp-growth算法在搜素引擎应用实验与分析第53-54页
    5.4 本章小结第54-56页
第六章 总结与展望第56-57页
    6.1 总结第56页
    6.2 展望第56-57页
致谢第57-58页
参考文献第58-61页
攻读硕士学位期间取得的成果第61-62页

论文共62页,点击 下载论文
上一篇:卫生信息标准符合性测试系统的研究与设计
下一篇:应急广播消息发送软件的设计与实现