首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于大数据的超市顾客购买行为分析研究与实现

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-14页
    1.1 研究背景第9-10页
    1.2 国内外研究现状第10-12页
        1.2.1 国外研究现状第10-11页
        1.2.2 国内研究现状第11-12页
    1.3 主要研究内容第12-13页
    1.4 本文组织结构第13-14页
第二章 相关技术与Spark分布式平台搭建第14-29页
    2.1 数据挖掘概述第14-16页
        2.1.1 数据挖掘的概念第14-15页
        2.1.2 数据挖掘的步骤第15-16页
    2.2 聚类分析第16-19页
        2.2.1 聚类分析概述第16-17页
        2.2.2 聚类分析算法第17-19页
    2.3 关联规则分析第19-20页
        2.3.1 关联规则定义第19页
        2.3.2 关联规则应用第19-20页
    2.4 Spark分布式计算框架第20-25页
        2.4.1 Spark的体系架构第20-22页
        2.4.2 Spark MLlib介绍第22页
        2.4.3 Scala语言特点第22-23页
        2.4.4 Spark运行时架构第23页
        2.4.5 Spark on YARN介绍第23-24页
        2.4.6 与Hadoop平台的对比第24-25页
    2.5 Spark开发环境及分布式集群搭建第25-28页
        2.5.1 集群硬件和软件环境第25-27页
        2.5.2 搭建分布式Spark集群第27-28页
    2.6 本章小结第28-29页
第三章 基于大数据的超市用户聚类分析第29-51页
    3.1 基于Spark的K-means算法实现第29-35页
        3.1.1 K-means算法分析第30-31页
        3.1.2 基于Spark MLlib实现并行化K-means算法思想第31-32页
        3.1.3 基于Spark的k-means算法核心代码分析第32-35页
    3.2 实验与分析第35-50页
        3.2.1 超市用户数据特征挖掘第35-44页
        3.2.2 用户聚类实验分析第44-49页
        3.2.3 Spark框架效率分析第49-50页
    3.3 本章小结第50-51页
第四章 基于大数据的超市商品关联规则挖掘第51-67页
    4.1 FP-Growth算法关联规则设计与实现第51-56页
        4.1.1 FP-Growth算法原理与流程第51-53页
        4.1.2 基于Spark的并行化FP-Growth算法实现第53-56页
    4.2 实验与分析第56-65页
        4.2.1 数据集第56-57页
        4.2.2 实验过程第57-61页
        4.2.3 实验结果分析第61-65页
    4.3 本章小结第65-67页
第五章 总结和展望第67-69页
    5.1 研究总结第67页
    5.2 未来研究展望第67-69页
参考文献第69-72页
致谢第72-73页
作者攻读学位期间发表的学术论文目录第73页

论文共73页,点击 下载论文
上一篇:基于LBSN个性化旅游行程推荐算法的研究与实现
下一篇:汇编程序在线评测系统和反抄袭的研究与实现