基于Spark的个性化推荐系统的研究与实现

摘要	第5-6页
abstract	第6-7页
第一章绪论	第11-16页
1.1 研究背景及意义	第11-12页
1.2 国内外研究现状	第12-14页
1.2.1 推荐系统的研究现状	第12-13页
1.2.2 分布式计算框架的研究现状	第13-14页
1.3 研究内容	第14-15页
1.4 论文的组织结构	第15-16页
第二章相关技术	第16-31页
2.1 大数据相关技术	第16-24页
2.1.1 Hadoop框架	第16-18页
2.1.2 Spark分布式计算框架	第18-23页
2.1.2.1 Spark简介	第18-19页
2.1.2.2 弹性分布式数据集RDD	第19-20页
2.1.2.3 Spark上层生态系统	第20-22页
2.1.2.4 Spark框架与编程模型	第22-23页
2.1.3 Parquet列式存储文件	第23-24页
2.2 推荐系统综述	第24-30页
2.2.1 推荐系统介绍	第24-25页
2.2.2 推荐系统算法	第25-28页
2.2.2.1 协同过滤算法	第25-27页
2.2.2.2 基于人口统计学的推荐	第27-28页
2.2.2.3 基于SVD的推荐	第28页
2.2.3 推荐系统评测	第28-30页
2.3 本章小结	第30-31页
第三章基于Spark的推荐系统的分析与设计	第31-46页
3.1 引言	第31页
3.2 系统架构	第31-43页
3.2.1 系统整体架构	第31-32页
3.2.2 高性能数据仓库的设计	第32-33页
3.2.3 推荐引擎组的分析与设计	第33-42页
3.2.3.1 基于用户的协同过滤算法分析	第33-38页
3.2.3.2 基于项目的协同过滤算法分析	第38-39页
3.2.3.3 协同过滤矩阵分解算法的改进	第39-42页
3.2.4 推荐结果处理模块	第42-43页
3.3 基于Spark的详细设计	第43-45页
3.3.1 Spark中的矩阵运算	第43-44页
3.3.2 推荐引擎算法Spark并行化设计	第44-45页
3.4 本章小结	第45-46页
第四章基于Spark的推荐系统的实现	第46-67页
4.1 数据集描述	第46-47页
4.2 高性能数据仓库的实现	第47-49页
4.2.1 数据仓库初始化	第47-48页
4.2.2 数据仓库Spark SQL实现	第48-49页
4.3 推荐引擎组实现	第49-66页
4.3.1 User-based协同过滤算法Spark并行化实现	第49-50页
4.3.2 Item-based协同过滤算法的Spark并行化实现	第50-56页
4.3.3 基于SVD的推荐	第56-60页
4.3.4 基于内容的推荐	第60-64页
4.3.5 MLlib协同过滤实现电影推荐	第64-66页
4.4 本章小结	第66-67页
第五章实验结果与分析	第67-74页
5.1 实验环境	第67-68页
5.1.1 实验软硬件环境	第67页
5.1.2 实验数据	第67-68页
5.1.3 优化Spark性能	第68页
5.2 实验分析与设计	第68-69页
5.2.1 计算速度实验设计	第69页
5.2.2 测评指标实验设计	第69页
5.3 测评结果	第69-72页
5.4 本章小结	第72-74页
第六章全文总结与展望	第74-76页
致谢	第76-77页
参考文献	第77-81页