大数据平台下推荐系统的研究与实现

摘要	第3-4页
abstract	第4-5页
第1章绪论	第9-14页
1.1 研究背景与意义	第9-10页
1.2 国内外研究现状	第10-12页
1.2.1 推荐系统研究现状	第10-11页
1.2.2 基于Spark平台推荐系统研究现状	第11-12页
1.3 研究内容	第12-13页
1.4 本文组织结构	第13-14页
第2章相关技术	第14-28页
2.1 大数据计算平台	第14-19页
2.1.1 Spark简介	第14-15页
2.1.2 Spark架构	第15-16页
2.1.3 SparkCore	第16-17页
2.1.4 Spark组件	第17-19页
2.2 推荐系统	第19-24页
2.2.1 推荐系统概述	第19-20页
2.2.2 推荐算法分类	第20-23页
2.2.3 推荐系统评测	第23-24页
2.3 其他技术	第24-27页
2.3.1 分布式文件系统HDFS	第24-25页
2.3.2 分布式流消息系统Kafka	第25-26页
2.3.3 列式数据库HBase	第26-27页
2.4 本章小结	第27-28页
第3章基于Spark的协同过滤推荐算法研究	第28-40页
3.1 基于最近邻用户的推荐算法优化	第28-32页
3.1.1 基于用户的最近邻推荐方法	第28-30页
3.1.2 存在的问题与优化分析	第30-31页
3.1.3 基于RecTree的最近邻推荐方法	第31-32页
3.2 基于ALS模型的推荐算法优化	第32-37页
3.2.1 基于ALS模型的推荐方法	第33-34页
3.2.2 ALS推荐算法改进设计	第34-35页
3.2.3 KNN-ALS推荐算法的实现	第35-37页
3.3 推荐算法并行化分析	第37-39页
3.3.1 基于最近邻用户推荐算法并行化分析	第37-38页
3.3.2 ALS推荐算法并行化分析	第38-39页
3.4 本章小结	第39-40页
第4章基于Spark的推荐系统研究与实现	第40-53页
4.1 需求分析	第40-41页
4.2 系统的总体架构	第41-43页
4.2.1 离线推荐架构	第41-42页
4.2.2 在线推荐架构	第42-43页
4.3 离线推荐的设计与实现	第43-47页
4.3.1 数据仓库	第43-45页
4.3.2 推荐引擎模块	第45-47页
4.3.3 结果输出模块	第47页
4.4 在线推荐的设计与实现	第47-52页
4.4.1 Kafka评分模拟模块	第47-49页
4.4.2 实时流计算模块	第49-51页
4.4.3 流数据输出模块	第51-52页
4.5 本章小结	第52-53页
第5章实验与测试	第53-63页
5.1 实验环境	第53-54页
5.1.1 硬件环境	第53页
5.1.2 软件环境	第53-54页
5.2 实验数据	第54-55页
5.3 实验测试	第55-62页
5.3.1 数据仓库测试	第56-57页
5.3.2 离线算法测试	第57-61页
5.3.3 在线算法测试	第61-62页
5.4 本章小结	第62-63页
第6章总结与展望	第63-66页
6.1 全文总结	第63-64页
6.2 未来展望	第64-66页
参考文献	第66-70页
致谢	第70-71页
个人简历、在学期间发表的学术论文及研究成果	第71页