摘要 | 第6-7页 |
Abstract | 第7-8页 |
第1章 绪论 | 第11-19页 |
1.1 课题背景 | 第11-12页 |
1.2 课题的目的及意义 | 第12-13页 |
1.3 国内外研究现状 | 第13-16页 |
1.4 本文的组织结构 | 第16-19页 |
第2章 相关技术 | 第19-32页 |
2.1 大数据处理框架简介 | 第19-25页 |
2.1.1 Hadoop简介 | 第19-20页 |
2.1.2 Spark简介 | 第20-23页 |
2.1.3 Python简介 | 第23-25页 |
2.2 相关算法研究 | 第25-31页 |
2.2.1 协同过滤算法 | 第25-29页 |
2.2.2 关联规则算法 | 第29-31页 |
2.3 本章小结 | 第31-32页 |
第3章 基于关联规则的协同过滤算法 | 第32-42页 |
3.1 相似度的计算方法 | 第32-34页 |
3.2 传统协同过滤算法的问题分析 | 第34-35页 |
3.3 结合关联规则的协同过滤算法 | 第35-36页 |
3.4 算法设计 | 第36-38页 |
3.5 算法有效性检验 | 第38-41页 |
3.5.1 实验数据集 | 第38页 |
3.5.2 数据预处理 | 第38页 |
3.5.3 求均方根误差的算法设计 | 第38-40页 |
3.5.4 算法的评价指标: | 第40页 |
3.5.5 实验结果与分析 | 第40-41页 |
3.6 本章小结 | 第41-42页 |
第4章 相关算法分布式的设计与实现 | 第42-50页 |
4.1 MLLib | 第42-43页 |
4.2 基于项目的协同过滤算法分布式的实现 | 第43-46页 |
4.3 FP-Growth算法的分布式的实现 | 第46-47页 |
4.3.1 FP-Growth算法 | 第46-47页 |
4.3.2 基于Spark的FP-Growth算法的分布式实现 | 第47页 |
4.4 基于关联规则的协同过滤算法的分布式的设计 | 第47-49页 |
4.5 本章小结 | 第49-50页 |
第5章 分布式关联规则协同过滤算法实现与验证 | 第50-57页 |
5.1 推荐系统的架构 | 第50-51页 |
5.2 开发环境搭建 | 第51-53页 |
5.3 实验数据集 | 第53页 |
5.4 实验方案设计 | 第53-54页 |
5.5 实验结果与分析 | 第54-56页 |
5.6 本章小结 | 第56-57页 |
结论 | 第57-59页 |
参考文献 | 第59-64页 |
攻读硕士学位期间发表的论文和取得的科研成果 | 第64-65页 |
致谢 | 第65-66页 |