中文摘要 | 第3-4页 |
Abstract | 第4-5页 |
第一章 引言 | 第8-14页 |
1.1 选题背景及意义 | 第8-9页 |
1.2 国内外研究现状 | 第9-11页 |
1.2.1 传统关联规则算法研究现状 | 第9-10页 |
1.2.2 大数据环境下关联规则算法研究现状 | 第10-11页 |
1.3 论文的主要内容及结构安排 | 第11-14页 |
第二章 分布式并行系统基础架构相关知识 | 第14-22页 |
2.1 Hadoop简介 | 第14-15页 |
2.2 分布式文件系统HDFS | 第15-16页 |
2.3 并行计算框架MapReduce | 第16-17页 |
2.4 Spark大数据处理架构 | 第17-20页 |
2.5 本章小结 | 第20-22页 |
第三章 基于Spark的改进Apriori算法研究 | 第22-38页 |
3.1 关联规则 | 第22-24页 |
3.2 Apriori算法 | 第24-25页 |
3.2.1 Apriori算法原理 | 第24-25页 |
3.2.2 Apriori算法的缺陷 | 第25页 |
3.3 基于Spark的改进Apriori算法 | 第25-28页 |
3.3.1 Apriori算法改进 | 第25-26页 |
3.3.2 Spark+IApriori算法 | 第26-28页 |
3.4 实验验证 | 第28-36页 |
3.4.1 平台搭建 | 第28-32页 |
3.4.2 实验结果 | 第32-36页 |
3.5 本章小结 | 第36-38页 |
第四章 基于Spark的改进FP-growth算法研究 | 第38-48页 |
4.1 FP-growth算法 | 第38-39页 |
4.1.1 FP-growth算法原理 | 第38-39页 |
4.1.2 FP-growth算法的缺陷 | 第39页 |
4.2 基于Spark的改进FP-growth算法 | 第39-43页 |
4.2.1 FP-growth算法改进 | 第39-41页 |
4.2.2 SIFP算法 | 第41-43页 |
4.3 实验验证 | 第43-46页 |
4.4 本章小结 | 第46-48页 |
第五章 结论和展望 | 第48-50页 |
5.1 结论 | 第48页 |
5.2 展望 | 第48-50页 |
参考文献 | 第50-56页 |
致谢 | 第56-58页 |
攻读硕士期间发表学术论文情况 | 第58页 |