基于Spark的推荐算法研究

摘要	第6-7页
abstract	第7-8页
第1章绪论	第11-17页
1.1 研究背景及意义	第11-12页
1.2 国内外研究现状	第12-14页
1.2.1 推荐算法的研究现状	第12-13页
1.2.2 并行计算框架的研究现状	第13-14页
1.3 主要研究内容	第14-15页
1.4 论文组织结构	第15-17页
第2章协同过滤算法以及Spark框架	第17-30页
2.1 协同过滤推荐算法	第17-21页
2.1.1 协同过滤算法分类及其原理	第17-20页
2.1.1.1 基于用户的协同过滤算法	第17-18页
2.1.1.2 基于项目的协同过滤算法	第18-20页
2.1.1.3 基于模型的协同过滤算法	第20页
2.1.2 协同过滤算法评价标准	第20-21页
2.2 Spark并行计算框架	第21-29页
2.2.1 传统并行计算架构	第21-22页
2.2.2 Spark并行计算架构	第22-24页
2.2.2.1 Spark并行计算的特点	第22-23页
2.2.2.2 Spark并行框架组件	第23-24页
2.2.2.3 Spark并行计算工作原理	第24页
2.2.3 弹性分布式数据集RDD	第24-27页
2.2.3.1 RDD分区原理	第24-26页
2.2.3.2 RDD的特性	第26-27页
2.2.4 Spark生态系统	第27-29页
2.3 本章小节	第29-30页
第3章结合LDA主题模型的推荐算法	第30-43页
3.1 传统协同过滤算法存在的问题	第30页
3.2 ALS算法	第30-32页
3.3 LDA主题模型	第32-34页
3.3.1 主题模型概念	第32页
3.3.2 LDA主题模型	第32-34页
3.4 改进算法	第34-39页
3.4.1 文件处理及主题分部计算	第35-36页
3.4.2 项目相似度矩阵求解	第36-38页
3.4.3 预评分求解及填充	第38-39页
3.4.4 矩阵分解及推荐	第39页
3.5 实验仿真	第39-41页
3.5.1 改进算法对比ALS算法	第39-41页
3.5.2 改进算法对比其他推荐算法	第41页
3.6 实验结果分析	第41-42页
3.7 本章小节	第42-43页
第4章结合LDA主题模型的并行推荐算法	第43-60页
4.1 串行算法的问题	第43页
4.2 SparkLDA和SparkALS算法并行化原理	第43-49页
4.2.1 SparkLDA算法	第43-46页
4.2.2 SparkALS算法	第46-49页
4.3 基于主题模型的并行推荐算法	第49-54页
4.3.1 文件处理及文档-主题分布	第49-51页
4.3.2 项目相似度RDD	第51-52页
4.3.3 预评分并行求解	第52-53页
4.3.4 矩阵分解并行训练及推荐	第53-54页
4.4 并行算法实验仿真	第54-58页
4.4.1 实验数据集	第54页
4.4.2 实验环境搭建	第54-56页
4.4.3 实验设计	第56-58页
4.5 结果分析	第58-59页
4.6 本章小节	第59-60页
总结与展望	第60-61页
致谢	第61-62页
参考文献	第62-66页
攻读硕士学位期间发表论文	第66页