致谢 | 第5-6页 |
摘要 | 第6-7页 |
Abstract | 第7-8页 |
1 绪论 | 第13-22页 |
1.1 课题背景 | 第13-19页 |
1.1.1 问题的提出 | 第13-18页 |
1.1.2 研究意义 | 第18-19页 |
1.2 国内外研究现状 | 第19-20页 |
1.3 论文主要工作及创新 | 第20页 |
1.4 论文章节安排 | 第20-22页 |
2 数据挖掘和Spark理论 | 第22-33页 |
2.1 数据挖掘基础 | 第22-26页 |
2.1.1 分类 | 第22-23页 |
2.1.2 聚类 | 第23-25页 |
2.1.3 关联规则 | 第25-26页 |
2.2 Spark基础 | 第26-31页 |
2.2.1 Spark | 第26-28页 |
2.2.2 Spark Streaming | 第28-31页 |
2.3 Mllib简介 | 第31页 |
2.4 小结 | 第31-33页 |
3 分类分析 | 第33-40页 |
3.1 Spark上的分类实现 | 第33页 |
3.2 Spark Streaming上的朴素贝叶斯分类 | 第33-36页 |
3.2.1 实现原理 | 第33-36页 |
3.2.2 实现步骤 | 第36页 |
3.3 在垃圾短信分类的应用 | 第36-39页 |
3.3.1 应用环境 | 第36-38页 |
3.3.2 应用结果分析 | 第38-39页 |
3.4 小结 | 第39-40页 |
4 聚类分析 | 第40-51页 |
4.1 Spark上的聚类实现 | 第40页 |
4.2 K-means算法 | 第40-42页 |
4.3 CBOG算法 | 第42-45页 |
4.3.1 判断函数 | 第43-44页 |
4.3.2 准则函数 | 第44页 |
4.3.3 算法描述 | 第44-45页 |
4.4 单机实验 | 第45-46页 |
4.5 商圈发现中的应用 | 第46-50页 |
4.5.1 应用环境 | 第47页 |
4.5.2 应用结果分析 | 第47-50页 |
4.6 小结 | 第50-51页 |
5 关联规则 | 第51-56页 |
5.1 Apriori算法 | 第51-52页 |
5.2 Spark上的Apriori算法实现 | 第52-53页 |
5.2.1 实现原理 | 第52页 |
5.2.2 实现步骤 | 第52-53页 |
5.3 实验及结果分析 | 第53-55页 |
5.3.1 实验环境 | 第53页 |
5.3.2 结果分析 | 第53-55页 |
5.4 小结 | 第55-56页 |
6 总结与展望 | 第56-58页 |
6.1 论文工作总结 | 第56页 |
6.2 展望 | 第56-58页 |
参考文献 | 第58-62页 |
作者简历 | 第62页 |