首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

分布式关联规则挖掘方法及应用研究

摘要第4-5页
ABSTRACT第5-6页
第1章 绪论第9-16页
    1.1 课题研究背景及意义第9-10页
    1.2 国内外研究现状及分析第10-14页
    1.3 本文主要研究内容第14-15页
    1.4 本文的结构第15-16页
第2章 面向关联规则算法的分布式计算框架研究第16-25页
    2.1 引言第16页
    2.2 系统总体架构第16-17页
    2.3 关联规则算法介绍及选择第17-19页
        2.3.1 Apriori算法第17-18页
        2.3.2 FP-Growth算法第18-19页
    2.4 分布式计算框架的介绍及选择第19-24页
        2.4.1 分布式计算框架Hadoop第20-22页
        2.4.2 基于内存的计算框架Spark第22-23页
        2.4.3 Hadoop和Spark对比研究第23-24页
    2.5 本章小结第24-25页
第3章 基于组负载均衡的GBPFP算法第25-42页
    3.1 引言第25页
    3.2 单机FP-GROWTH算法的局限第25-26页
    3.3 基于组负载均衡的分布式关联规则算法第26-34页
        3.3.1 基于组负载均衡的GBPFP算法第26-27页
        3.3.2 并行计数过程第27-28页
        3.3.3 并行组划分负载均衡过程第28-30页
        3.3.4 并行挖掘频繁项集过程第30-33页
        3.3.5 并行频繁项集去重过程第33-34页
    3.4 用于推荐系统的频繁闭项集及极大频繁项集第34-35页
    3.5 对比实验第35-41页
        3.5.1 组负载均衡数据分配的实验第35-37页
        3.5.2 频繁闭项集及极大频繁项集生成第37-38页
        3.5.3 基于Spark框架下的实验第38-41页
    3.6 本章小结第41-42页
第4章 基于分布式关联规则的贴吧个性化推荐系统第42-54页
    4.1 引言第42页
    4.2 贴吧个性化推荐系统结构设计第42-43页
    4.3 数据处理系统的设计与实现第43-48页
        4.3.1 数据源说明第44-45页
        4.3.2 数据处理系统结构第45-46页
        4.3.3 数据处理系统设计及实现流程第46-48页
    4.4 贴吧个性化推荐系统第48-49页
    4.5 基于生成频繁项集的推荐方案的改进第49-51页
        4.5.1 频繁项集及贴吧的聚类第49页
        4.5.2 关联规则过滤第49-51页
    4.6 基于百度贴吧个人用户的个性化推荐应用第51-53页
        4.6.1 频繁项集测试实验第51-52页
        4.6.2 推荐方案形成第52-53页
    4.7 本章小结第53-54页
结论第54-56页
参考文献第56-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:Y企业集团财务管理模式问题与对策研究
下一篇:C公司基层员工绩效考核研究