分布式关联规则挖掘方法及应用研究

摘要	第4-5页
ABSTRACT	第5-6页
第1章绪论	第9-16页
1.1 课题研究背景及意义	第9-10页
1.2 国内外研究现状及分析	第10-14页
1.3 本文主要研究内容	第14-15页
1.4 本文的结构	第15-16页
第2章面向关联规则算法的分布式计算框架研究	第16-25页
2.1 引言	第16页
2.2 系统总体架构	第16-17页
2.3 关联规则算法介绍及选择	第17-19页
2.3.1 Apriori算法	第17-18页
2.3.2 FP-Growth算法	第18-19页
2.4 分布式计算框架的介绍及选择	第19-24页
2.4.1 分布式计算框架Hadoop	第20-22页
2.4.2 基于内存的计算框架Spark	第22-23页
2.4.3 Hadoop和Spark对比研究	第23-24页
2.5 本章小结	第24-25页
第3章基于组负载均衡的GBPFP算法	第25-42页
3.1 引言	第25页
3.2 单机FP-GROWTH算法的局限	第25-26页
3.3 基于组负载均衡的分布式关联规则算法	第26-34页
3.3.1 基于组负载均衡的GBPFP算法	第26-27页
3.3.2 并行计数过程	第27-28页
3.3.3 并行组划分负载均衡过程	第28-30页
3.3.4 并行挖掘频繁项集过程	第30-33页
3.3.5 并行频繁项集去重过程	第33-34页
3.4 用于推荐系统的频繁闭项集及极大频繁项集	第34-35页
3.5 对比实验	第35-41页
3.5.1 组负载均衡数据分配的实验	第35-37页
3.5.2 频繁闭项集及极大频繁项集生成	第37-38页
3.5.3 基于Spark框架下的实验	第38-41页
3.6 本章小结	第41-42页
第4章基于分布式关联规则的贴吧个性化推荐系统	第42-54页
4.1 引言	第42页
4.2 贴吧个性化推荐系统结构设计	第42-43页
4.3 数据处理系统的设计与实现	第43-48页
4.3.1 数据源说明	第44-45页
4.3.2 数据处理系统结构	第45-46页
4.3.3 数据处理系统设计及实现流程	第46-48页
4.4 贴吧个性化推荐系统	第48-49页
4.5 基于生成频繁项集的推荐方案的改进	第49-51页
4.5.1 频繁项集及贴吧的聚类	第49页
4.5.2 关联规则过滤	第49-51页
4.6 基于百度贴吧个人用户的个性化推荐应用	第51-53页
4.6.1 频繁项集测试实验	第51-52页
4.6.2 推荐方案形成	第52-53页
4.7 本章小结	第53-54页
结论	第54-56页
参考文献	第56-61页
致谢	第61页