摘要 | 第5-6页 |
Abstract | 第6-7页 |
第1章 绪论 | 第11-17页 |
1.1 课题研究背景和意义 | 第11-13页 |
1.2 课题的研究现状 | 第13-15页 |
1.2.1 Hadoop的发展现状 | 第13页 |
1.2.2 数据挖掘的研究现状 | 第13-14页 |
1.2.3 推荐算法的研究现状 | 第14-15页 |
1.3 课题的研究内容 | 第15-16页 |
1.4 论文结构安排 | 第16-17页 |
第2章 Hadoop相关技术 | 第17-25页 |
2.1 Hadoop简介 | 第17-18页 |
2.2 HDFS | 第18-21页 |
2.2.1 HDFS介绍 | 第18-19页 |
2.2.2 HDFS的架构和工作原理 | 第19-21页 |
2.2.3 HDFS数据存储的保证措施 | 第21页 |
2.3 MapReduce的并行计算架构 | 第21-23页 |
2.3.1 MapReduce体系架构概述 | 第21-22页 |
2.3.2 MapReduce的工作流程 | 第22-23页 |
2.4 本章小结 | 第23-25页 |
第3章 K-means算法Map Reduce并行化设计 | 第25-39页 |
3.1 聚类算法概述 | 第25-27页 |
3.1.1 聚类分析的基本概念 | 第25-26页 |
3.1.2 聚类算法中的距离度量 | 第26-27页 |
3.2 聚类方法分类 | 第27-29页 |
3.2.1 划分方法 | 第27-28页 |
3.2.2 层次的方法 | 第28-29页 |
3.2.3 基于密度的方法 | 第29页 |
3.2.4 基于网格的方法 | 第29页 |
3.2.5 基于模型的方法 | 第29页 |
3.3 K-Means算法 | 第29-32页 |
3.3.1 K-means算法介绍 | 第29-30页 |
3.3.2 K-means算法性能分析 | 第30-32页 |
3.4 聚类算法K-Means改进及其MapReduce并行化设计 | 第32-37页 |
3.4.1 K-means算法改进 | 第32-33页 |
3.4.2 最大最小值算法MapReduce设计 | 第33-34页 |
3.4.3 基于最大最小值的K-means算法的MapReduce设计 | 第34-37页 |
3.5 本章小结 | 第37-39页 |
第4章 基于Hadoop的混合推荐算法 | 第39-54页 |
4.1 推荐系统概述 | 第39-40页 |
4.2 推荐系统的架构 | 第40-41页 |
4.3 常用推荐算法研究 | 第41-46页 |
4.3.1 基于内容的推荐 | 第41-42页 |
4.3.2 基于关联规则的推荐 | 第42-43页 |
4.3.3 协同过滤推荐 | 第43-46页 |
4.4 协同过滤算法相识度度量与并行化 | 第46-48页 |
4.4.1 相识度度量方法 | 第46-48页 |
4.5 基于Hadoop的聚类协同过滤推荐算法 | 第48-53页 |
4.5.1 矩阵分解预处理数据集 | 第49-51页 |
4.5.2 基于聚类模型的协同过滤推荐 | 第51-53页 |
4.6 算法扩展性验证 | 第53页 |
4.7 本章小结 | 第53-54页 |
第5章 Hadoop集群下MoviesLens数据集电影推荐 | 第54-65页 |
5.1 Hadoop集群平台的搭建 | 第54-56页 |
5.1.1 实验集群环境与架构 | 第54页 |
5.1.2 Hadoop集群的配置 | 第54-56页 |
5.2 电影数据集MoviesLens介绍 | 第56-57页 |
5.3 常用评估标准 | 第57-58页 |
5.3.1 精确度 | 第57-58页 |
5.3.2 覆盖率 | 第58页 |
5.4 实验设计与分析 | 第58-64页 |
5.4.1 推荐算法中相识度的选取 | 第58-59页 |
5.4.2 推荐算法中邻居大小的确定 | 第59-60页 |
5.4.3 协同过滤推荐算法推荐质量的比较 | 第60-62页 |
5.4.4 算法的应用性能评估 | 第62-64页 |
5.5 本章小结 | 第64-65页 |
第6章 总结与展望 | 第65-67页 |
6.1 总结 | 第65-66页 |
6.2 展望 | 第66-67页 |
参考文献 | 第67-72页 |
致谢 | 第72-73页 |
附录A 攻读硕士学位期间发表的论文情况 | 第73-74页 |
附录B 攻读学位期间参与科研工作情况 | 第74页 |