基于Spark的关联规则挖掘算法研究与应用

摘要	第5-6页
Abstract	第6-7页
第一章绪论	第10-16页
1.1 研究背景及意义	第10-11页
1.2 国内外研究现状	第11-13页
1.3 本文主要内容	第13-14页
1.4 论文组织	第14-16页
第二章相关理论与技术	第16-27页
2.1 Hadoop	第16-17页
2.2 Scala	第17-19页
2.3 Spark	第19-24页
2.3.1 Spark框架概述	第19-20页
2.3.2 Spark的模块设计	第20-21页
2.3.3 Spark的RDD算子	第21-23页
2.3.4 Spark共享变量	第23-24页
2.4 频繁模式挖掘算法	第24-26页
2.4.1 数据挖掘简述	第24-25页
2.4.2 关联规则挖掘算法	第25-26页
2.5 本章小结	第26-27页
第三章并行化广度优先频繁项集挖掘算法PTBS	第27-36页
3.1 投影树算法	第27页
3.2 基于Spark的PTBS算法	第27-31页
3.3 实验与分析	第31-35页
3.3.1 加速比测试	第32-33页
3.3.2 数据可扩展性测试	第33-35页
3.3.3 节点可扩展性测试	第35页
3.4 本章小结	第35-36页
第四章并行化深度优先频繁项集挖掘算法SPEclat	第36-44页
4.1 Eclat算法	第36-37页
4.2 SPEclat算法	第37-40页
4.3 实验与分析	第40-43页
4.3.1 加速比测试	第40-41页
4.3.2 数据可扩展性测试	第41-42页
4.3.3 节点可扩展性测试	第42-43页
4.4 本章小结	第43-44页
第五章 SPEclat算法在QAR数据中的应用	第44-50页
5.1 QAR数据简介	第44-45页
5.2 数据预处理	第45-46页
5.3 SPEclat在QAR数据中的应用	第46-49页
5.4 本章小结	第49-50页
第六章总结与展望	第50-52页
6.1 本文主要工作及特色	第50页
6.2 下一步研究方向	第50-52页
参考文献	第52-57页
致谢	第57-58页
作者简介	第58页