基于Spark平台分层协同过滤算法研究

摘要	第5-6页
abstract	第6页
第一章绪论	第10-16页
1.1 研究背景与意义	第10-11页
1.2 国内外研究现状	第11-14页
1.3 本文研究内容	第14-15页
1.4 本文的内容结构	第15-16页
第二章推荐系统与分布式技术	第16-30页
2.1 推荐系统	第16-20页
2.1.1 推荐系统概述	第16-17页
2.1.2 推荐技术分类	第17-19页
2.1.3 推荐系统评测指标	第19-20页
2.2 Hadoop分布式计算平台	第20-23页
2.2.1 adoop概述	第20-21页
2.2.2 Hadoop体系结构	第21-22页
2.2.3 Hadoop平台存在问题	第22-23页
2.3 Spark分布式计算平台	第23-29页
2.3.1 Spark概述	第23-24页
2.3.2 Spark编程模型	第24-26页
2.3.3 Spark系统架构	第26-27页
2.3.4 Spark容错机制	第27-28页
2.3.5 Spark与Hadoop相比性能优势	第28-29页
2.4 本章小结	第29-30页
第三章一种分层联合聚类协同过滤算法	第30-44页
3.1 协同过滤算法	第30-35页
3.1.1 协同过滤基本原理	第30-32页
3.1.2 基于用户的协同过滤	第32-33页
3.1.3 基于项目的协同过滤	第33-35页
3.2 AHCCF算法分析	第35-39页
3.2.1 问题描述与解决	第35-36页
3.2.2 算法改进思想	第36页
3.2.3 算法改进方案	第36-39页
3.3 AHCCF算法设计	第39-43页
3.3.1 联合聚类处理	第39-40页
3.3.2 用户类别权重计算	第40-42页
3.3.3 相似度计算与评分预测	第42-43页
3.4 本章小结	第43-44页
第四章 AHCCF算法并行化	第44-60页
4.1 K-means聚类算法并行化设计	第44-50页
4.1.1 K-means聚类中心初始化	第45-48页
4.1.2 K-means聚类并行化设计与实现	第48-50页
4.2 AHCCF算法并行化	第50-56页
4.2.1 用户维和项目维联合聚类	第51-52页
4.2.2 层次分析模型计算权重	第52-53页
4.2.3 用户聚类相似计算	第53-54页
4.2.4 最近邻居推荐	第54-56页
4.3 AHCCF算法并行化问题与解决	第56-58页
4.3.1 数据集加载	第56页
4.3.2 评分密集度	第56-57页
4.3.3 推荐列表计算	第57-58页
4.4 本章小结	第58-60页
第五章实验及结果分析	第60-68页
5.1 实验环境	第60-61页
5.1.1 实验运行环境	第60页
5.1.2 实验数据集	第60-61页
5.2 实验设计	第61-62页
5.2.1 算法准确度实验	第61页
5.2.2 算法并行化实验	第61-62页
5.3 实验结果及分析	第62-66页
5.3.1 算法准确度实验	第62-64页
5.3.2 算法并行化实验	第64-66页
5.4 本章小结	第66-68页
第六章结论与展望	第68-70页
6.1 结论	第68页
6.2 展望	第68-70页
参考文献	第70-74页
攻读学位期间所取得的相关科研成果	第74-76页
致谢	第76-77页