基于项目的协同过滤推荐算法改进及在Spark上并行化实现

摘要	第5-6页
Abstract	第6-7页
第1章绪论	第12-18页
1.1 研究背景及意义	第12-13页
1.2 国内外研究现状	第13-16页
1.3 论文主要研究内容	第16页
1.4 论文组织结构	第16-18页
第2章相关技术与概念	第18-30页
2.1 推荐算法和相似度算法	第18-23页
2.1.1 基于领域的推荐算法	第18-21页
2.1.2 基于模型的推荐算法	第21-22页
2.1.3 相似度算法	第22-23页
2.2 Spark分布式计算平台	第23-27页
2.2.1 Spark平台概述	第23-24页
2.2.2 弹性分布式数据集	第24-26页
2.2.3 Spark平台运行架构	第26-27页
2.3 推荐系统评测指标	第27-29页
2.4 本章小结	第29-30页
第3章基于项目的协同过滤算法改进设计	第30-38页
3.1 基于项目的协同过滤算法问题分析	第30-33页
3.2 基于项目的协同过滤算法改进	第33-37页
3.2.1 项目属性特征相似度算法	第34-35页
3.2.2 项目最终相似度和评分预测算法	第35-37页
3.3 本章小结	第37-38页
第4章基于Spark平台的协同过滤算法并行化	第38-54页
4.1 基于Spark平台的并行计算特点分析	第38-43页
4.1.1 数据并行化过程分析	第39-41页
4.1.2 任务并行化过程分析	第41-43页
4.2 基于Spark平台的改进后协同过滤算法实现	第43-53页
4.2.1 构造带有时间上下文的用户项目评分矩阵	第44-45页
4.2.2 计算带有时间上下文的项目评分相似度	第45-47页
4.2.3 计算项目属性特征相似度	第47-49页
4.2.4 计算带有时间上下文的预测评分	第49-52页
4.2.5 Top-N推荐计算	第52-53页
4.3 本章小结	第53-54页
第5章实验设计与结果分析	第54-68页
5.1 实验平台软硬件环境	第54-57页
5.2 实验数据集	第57-59页
5.3 实验与结果分析	第59-67页
5.3.1 准确度指标评测	第59-63页
5.3.2 并行运行效率评测	第63-67页
5.4 本章小结	第67-68页
结论	第68-70页
参考文献	第70-74页
致谢	第74-75页
附录A 攻读学位期间所参与的实践项目	第75页