基于Spark的关联规则算法研究与实现

摘要	第4-5页
ABSTRACT	第5-6页
第一章绪论	第9-15页
1.1 选题背景及意义	第9-11页
1.2 相关工作	第11-13页
1.2.1 分布式计算平台	第11页
1.2.2 基于MapReduce的关联规则算法	第11-12页
1.2.3 基于Spark的关联规则算法	第12-13页
1.3 论文的研究内容	第13页
1.4 论文组织结构	第13-15页
第二章相关概念、技术综述	第15-35页
2.1 相关概念	第15-21页
2.1.1 概述	第15页
2.1.2 数据库知识发现(KDD)	第15-17页
2.1.3 关联规则	第17-19页
2.1.4 高效用项集	第19-21页
2.2 相关技术	第21-34页
2.2.1 关联规则挖掘并行策略	第21-22页
2.2.2 Hadoop平台	第22-27页
2.2.3 Spark平台	第27-32页
2.2.4 Spark的优势及与Hadoop的对比分析	第32-34页
2.3 本章小结	第34-35页
第三章基于Spark的经典关联规则并行实现	第35-49页
3.1 Apriori	第35-39页
3.1.1 算法说明	第35-36页
3.1.2 算法分析	第36页
3.1.3 算法优化	第36-37页
3.1.4 基于Spark实现Apriori	第37-39页
3.2 FP-growth	第39-43页
3.2.1 算法说明	第39-41页
3.2.2 算法分析	第41-42页
3.2.3 基于Spark实现FP-growth	第42-43页
3.3 Eclat	第43-46页
3.3.1 算法说明	第44-45页
3.3.2 算法分析	第45页
3.3.3 算法优化	第45页
3.3.4 基于Spark实现Eclat	第45-46页
3.4 实验设计与结果	第46-49页
第四章基于Spark的高效用项集挖掘算法Spark-HUI-Miner	第49-61页
4.1 HUI-Miner简介	第49-51页
4.2 S-HUI-Miner	第51-56页
4.2.1 分割搜索空间	第52-53页
4.2.2 生成Node Data	第53页
4.2.3 挖掘Node Data	第53-56页
4.3 基于抽样的近似高效用项集挖掘	第56-59页
4.3.1 定义、引理	第56-58页
4.3.2 抽样策略	第58-59页
4.3.3 基于抽样的S-HUI-Miner	第59页
4.4 实验设计和结果	第59-61页
第五章结束语	第61-63页
5.1 论文总结	第61-62页
5.2 工作展望	第62-63页
参考文献	第63-66页
致谢	第66-68页
攻读学位期间发表的学术论文	第68页