基于Spark的分布式关联规则算法研究

摘要	第5-6页
abstract	第6-7页
第1章绪论	第10-16页
1.1 研究背景及意义	第10-11页
1.2 国内外现状	第11-14页
1.3 主要研究内容	第14页
1.4 论文大致结构	第14-16页
第2章相关知识及技术	第16-32页
2.1 引言	第16页
2.2 关联规则相关概念	第16-18页
2.2.1 关联规则的引入	第16-17页
2.2.2 关联规则的概念	第17-18页
2.2.3 关联规则算法	第18页
2.3 APRIORI算法	第18-20页
2.3.1 Apriori算法的主要思路	第18-19页
2.3.2 Apriori算法举例	第19-20页
2.4 FP-TREE算法	第20-24页
2.4.1 FP-tree算法的主要思路	第20-21页
2.4.2 FP-tree算法的描述	第21-22页
2.4.3 FP-tree算法举例	第22-24页
2.5 分布式计算环境相关概念	第24-30页
2.5.1 基于Hadoop的分布式计算环境	第25-26页
2.5.2 Spark分布式计算环境的引入	第26页
2.5.3 Spark分布式计算环境的分类	第26-28页
2.5.4 弹性分布式数据集（RDD）	第28-30页
2.6 本章小结	第30-32页
第3章基于SPARK的算法分析与优化	第32-46页
3.1 引言	第32-33页
3.2 基于SPARK的算法分析与比较	第33-35页
3.2.1 基于Spark的Apriori算法分析	第33-34页
3.2.2 基于Spark的FP-tree算法和CSFP-tree算法的比较分析	第34-35页
3.3 基于SPARK的算法优化与模型构建	第35-44页
3.3.1 CSFP-tree算法的主旨思想	第35页
3.3.2 CSFP-tree算法的描述	第35-36页
3.3.3 CSFP-tree算法的构建	第36-38页
3.3.4 基于Spark的CSFP-tree算法的提出目的	第38-39页
3.3.5 基于Spark的CSFP-tree算法的具体流程	第39-41页
3.3.6 均衡分组的策略	第41-43页
3.3.7 基于Spark的CSFP-tree算法的描述	第43-44页
3.4 本章小结	第44-46页
第4章基于SPARK的CSFP-TREE算法实现与分析	第46-53页
4.1 引言	第46页
4.2 实验环境以及数据集的选取	第46-48页
4.2.1 硬件环境	第46-47页
4.2.2 软件环境	第47-48页
4.2.3 实验数据集及评价标准	第48页
4.3 基于SPARK的CSFP-TREE算法实验及分析	第48-51页
4.3.1 实验 1	第48-49页
4.3.2 实验 2	第49-51页
4.4 本章小结	第51-53页
结论	第53-55页
参考文献	第55-59页
攻读硕士学位期间发表的论文和取得的科研成果	第59-61页
致谢	第61-62页