基于降维技术和分布式计算的协同过滤可扩展性问题解决方案
摘要 | 第1-6页 |
Abstract | 第6-10页 |
1 绪论 | 第10-17页 |
·研究背景 | 第10-12页 |
·国内外的研究现状 | 第12-14页 |
·协同过滤 | 第12-13页 |
·分布式计算 | 第13-14页 |
·主要问题 | 第14-16页 |
·组织结构 | 第16-17页 |
2 相关算法综述 | 第17-32页 |
·SVD | 第17-25页 |
·SVD简介 | 第17-20页 |
·SVD求解算法 | 第20-25页 |
·协同过滤 | 第25-32页 |
·协同过滤分类 | 第25-26页 |
·相似度计算方法 | 第26-27页 |
·相似邻居计算 | 第27-28页 |
·基于内存的协同过滤 | 第28-30页 |
·基于模型的协同过滤 | 第30-32页 |
3 分布式计算环境 | 第32-39页 |
·HDFS | 第33-36页 |
·Map-Reduce | 第36-39页 |
4 协同过滤可扩展性问题研究 | 第39-53页 |
·可扩展性问题研究 | 第39-40页 |
·基于降维和分布式的解决方案 | 第40-45页 |
·降维 | 第41-44页 |
·协同过滤算法的分布式扩展可行性 | 第44-45页 |
·基于内存的协同过滤的分布式实现 | 第45-49页 |
·KNN的分布式实现 | 第46-49页 |
·基于模型的协同过滤的分布式实现 | 第49-53页 |
·Slope one的分布式实现 | 第50-53页 |
5 实验及分析 | 第53-60页 |
·实验方案 | 第53-54页 |
·实验环境 | 第54页 |
·评判标准 | 第54-56页 |
·平均绝对误差 | 第54-55页 |
·准确率和召回率 | 第55-56页 |
·实验结果及分析 | 第56-60页 |
·数据集介绍 | 第56-57页 |
·实验结果 | 第57-60页 |
6 总结与展望 | 第60-62页 |
·文章总结 | 第60-61页 |
·工作展望 | 第61-62页 |
参考文献 | 第62-66页 |
附录 | 第66-69页 |
附录1:在发布式下计算KNN算法的相似度 | 第66-67页 |
附录2:Slope one相异度计算1 | 第67页 |
附录3:Slope one相异度计算2 | 第67-69页 |
致谢 | 第69页 |