基于Spark平台的协同过滤推荐算法的研究与实现

摘要	第3-4页
Abstract	第4页
1 绪论	第7-11页
1.1 研究背景	第7-8页
1.2 国内外研究现状	第8-9页
1.3 课题背景和研究内容	第9-10页
1.3.1 课题背景	第9-10页
1.3.2 研究内容	第10页
1.4 论文组织结构	第10-11页
2 基本理论与相关技术	第11-30页
2.1 推荐引擎技术	第11-15页
2.1.1 推荐引擎概要介绍	第11-12页
2.1.2 推荐引擎技术的分类	第12-14页
2.1.3 推荐引擎技术现存问题	第14-15页
2.2 协同过滤和相似度算法	第15-21页
2.2.1 基于用户的协同过滤推荐	第15-16页
2.2.2 基于物品的协同过滤推荐	第16-17页
2.2.3 Slope One算法	第17-19页
2.2.4 相似度算法	第19-21页
2.3 Spark分布式平台	第21-29页
2.3.1 Spark概述	第22页
2.3.2 弹性分布式数据集	第22-24页
2.3.3 Spark编程模型和运行架构	第24-26页
2.3.4 Spark MLlib机器学习	第26-29页
2.4 本章小结	第29-30页
3 Slope One算法的改进和并行化实现	第30-46页
3.1 Slope One算法及其改进策略	第30-34页
3.1.1 问题描述	第30页
3.1.2 算法描述	第30-32页
3.1.3 算法设计	第32-34页
3.2 基于物品和Slope One算法的并行化实现	第34-45页
3.2.1 对数似然相似度算法的并行化实现	第34-36页
3.2.2 Slope One算法的并行化实现	第36-39页
3.2.3 改进的协同过滤算法的并行化实现	第39-45页
3.3 本章小结	第45-46页
4 实验设计与结果分析	第46-55页
4.1 实验环境	第46-47页
4.1.1 软硬件环境	第46页
4.1.2 实验数据集	第46-47页
4.2 评价标准	第47-48页
4.2.1 评分预测的准确度	第47-48页
4.2.2 准确率和召回率	第48页
4.3 实验设计	第48-49页
4.4 实验结果分析	第49-54页
4.4.1 不同节点数目和不同平台的运行效率分析	第49-51页
4.4.2 不同大小的数据集的运行结果分析	第51-52页
4.4.3 不同比例的训练集和测试集的运行结果分析	第52-54页
4.5 本章小结	第54-55页
5 总结与展望	第55-57页
5.1 工作总结	第55页
5.2 工作展望	第55-57页
致谢	第57-58页
参考文献	第58-62页
附录	第62页