基于降维技术和分布式计算的协同过滤可扩展性问题解决方案
| 摘要 | 第1-6页 |
| Abstract | 第6-10页 |
| 1 绪论 | 第10-17页 |
| ·研究背景 | 第10-12页 |
| ·国内外的研究现状 | 第12-14页 |
| ·协同过滤 | 第12-13页 |
| ·分布式计算 | 第13-14页 |
| ·主要问题 | 第14-16页 |
| ·组织结构 | 第16-17页 |
| 2 相关算法综述 | 第17-32页 |
| ·SVD | 第17-25页 |
| ·SVD简介 | 第17-20页 |
| ·SVD求解算法 | 第20-25页 |
| ·协同过滤 | 第25-32页 |
| ·协同过滤分类 | 第25-26页 |
| ·相似度计算方法 | 第26-27页 |
| ·相似邻居计算 | 第27-28页 |
| ·基于内存的协同过滤 | 第28-30页 |
| ·基于模型的协同过滤 | 第30-32页 |
| 3 分布式计算环境 | 第32-39页 |
| ·HDFS | 第33-36页 |
| ·Map-Reduce | 第36-39页 |
| 4 协同过滤可扩展性问题研究 | 第39-53页 |
| ·可扩展性问题研究 | 第39-40页 |
| ·基于降维和分布式的解决方案 | 第40-45页 |
| ·降维 | 第41-44页 |
| ·协同过滤算法的分布式扩展可行性 | 第44-45页 |
| ·基于内存的协同过滤的分布式实现 | 第45-49页 |
| ·KNN的分布式实现 | 第46-49页 |
| ·基于模型的协同过滤的分布式实现 | 第49-53页 |
| ·Slope one的分布式实现 | 第50-53页 |
| 5 实验及分析 | 第53-60页 |
| ·实验方案 | 第53-54页 |
| ·实验环境 | 第54页 |
| ·评判标准 | 第54-56页 |
| ·平均绝对误差 | 第54-55页 |
| ·准确率和召回率 | 第55-56页 |
| ·实验结果及分析 | 第56-60页 |
| ·数据集介绍 | 第56-57页 |
| ·实验结果 | 第57-60页 |
| 6 总结与展望 | 第60-62页 |
| ·文章总结 | 第60-61页 |
| ·工作展望 | 第61-62页 |
| 参考文献 | 第62-66页 |
| 附录 | 第66-69页 |
| 附录1:在发布式下计算KNN算法的相似度 | 第66-67页 |
| 附录2:Slope one相异度计算1 | 第67页 |
| 附录3:Slope one相异度计算2 | 第67-69页 |
| 致谢 | 第69页 |