首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Spark的并行频繁项集挖掘算法研究及应用

摘要第5-6页
Abstract第6页
第一章 绪论第9-16页
    1.1 课题的背景及意义第9-11页
    1.2 国内外研究现状第11-14页
    1.3 本文的主要研究工作第14页
    1.4 本文的组织结构第14-16页
第二章 相关理论与技术第16-24页
    2.1 关联规则第16-18页
        2.1.1 关联规则基本概念第16-17页
        2.1.2 关联规则挖掘算法第17-18页
    2.2 Spark大数据处理架构第18-21页
        2.2.1 Spark的设计结构第18页
        2.2.2 RDD弹性分布式数据集第18-20页
        2.2.3 Spark平台的优势第20-21页
    2.3 推荐理论及相关技术第21-23页
        2.3.1 推荐系统介绍第21页
        2.3.2 相关推荐算法及比较第21-23页
    2.4 本章小结第23-24页
第三章 FP-Growth算法的改进及并行化研究第24-33页
    3.1 传统频繁项集挖掘算法第24-25页
        3.1.1 频繁项集挖掘算法原理第24-25页
        3.1.2 FP-Growth算法的缺点第25页
    3.2 FP-Growth算法的改进及实现第25-28页
        3.2.1 IFP算法的数据结构第26-27页
        3.2.2 IFP算法的剪枝策略及实现第27-28页
    3.3 基于Spark的IFP算法的并行化实现第28-32页
        3.3.1 导入数据集第28页
        3.3.2 支持度的并行计算第28-30页
        3.3.3 数据切分第30-31页
        3.3.4 IPFP算法的并行化执行第31-32页
    3.4 本章小结第32-33页
第四章 IPFP算法的应用第33-40页
    4.1 数据预处理第33-35页
        4.1.1 初始数据集第33-34页
        4.1.2 数据预处理第34-35页
    4.2 基于IPFP的图书推荐算法第35-39页
        4.2.1 推荐算法的实现步骤第36-37页
        4.2.2 实验结果第37页
        4.2.3 选书推荐服务第37-39页
    4.3 本章小结第39-40页
第五章 实验分析第40-49页
    5.1 实验环境的搭建第40-42页
        5.1.1 硬件信息第40页
        5.1.2 软件信息第40-41页
        5.1.3 Hadoop集群的部署第41-42页
        5.1.4 Spark集群的部署第42页
    5.2 IPFP算法性能分析第42-45页
        5.2.1 实验的评价标准第43页
        5.2.2 IPFP算法实验分析第43-45页
    5.3 图书推荐效果分析第45-47页
        5.3.1 实验的评价标准第45页
        5.3.2 图书推荐实验分析第45-47页
    5.4 本章小结第47-49页
第六章 总结与展望第49-51页
    6.1 总结第49页
    6.2 展望第49-51页
攻读硕士期间发表的论文第51-53页
参考文献第53-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:基于嵌入式Linux和微信的指纹考勤系统的设计
下一篇:不同难度教学视频中陈述性知识和程序性知识的呈现顺序对学习的影响