摘要 | 第3-4页 |
abstract | 第4-5页 |
1 绪论 | 第8-14页 |
1.1 研究的背景与意义 | 第8-9页 |
1.2 国内外研究现状 | 第9-11页 |
1.2.1 K-means算法的研究现状 | 第9-10页 |
1.2.2 推荐系统的研究现状 | 第10-11页 |
1.3 研究内容及结果 | 第11页 |
1.4 论文的章节安排 | 第11-14页 |
2 相关技术介绍 | 第14-20页 |
2.1 Hadoop分布式系统基础架构 | 第14页 |
2.2 MapReduce计算模型 | 第14-16页 |
2.2.1 MapReduce概述 | 第14-15页 |
2.2.2 MapReduce基本原理 | 第15页 |
2.2.3 MapReduce运行流程 | 第15-16页 |
2.3 HDFS分布式文件系统 | 第16-18页 |
2.3.1 HDFS概述 | 第16页 |
2.3.2 HDFS基本组成 | 第16-17页 |
2.3.3 HDFS读写机制 | 第17-18页 |
2.4 本章小结 | 第18-20页 |
3 改进的并行抽样K-means算法 | 第20-32页 |
3.1 聚类分析 | 第20-23页 |
3.1.1 聚类相关符号及定义 | 第20-21页 |
3.1.2 聚类准则函数 | 第21页 |
3.1.3 聚类分析过程 | 第21-23页 |
3.2 K-means算法 | 第23页 |
3.3 MapReduce下改进的并行抽样K-means算法 | 第23-28页 |
3.3.1 IPSK算法设计 | 第23-26页 |
3.3.2 基于MapRuduce的IPSK算法流程 | 第26-28页 |
3.4 研究结果与分析 | 第28-30页 |
3.4.1 时间性能测试与分析 | 第28-29页 |
3.4.2 稳定性及准确率测试与分析 | 第29-30页 |
3.5 本章小结 | 第30-32页 |
4 基于IPSK的用户协同过滤推荐算法 | 第32-42页 |
4.1 常见的推荐算法研究 | 第32-34页 |
4.1.1 基于内容的推荐算法 | 第32页 |
4.1.2 协同过滤推荐算法 | 第32-34页 |
4.2 算法评价指标 | 第34-36页 |
4.2.1 相似度计算方法 | 第34-35页 |
4.2.2 预测评分 | 第35页 |
4.2.3 推荐质量评价指标 | 第35-36页 |
4.3 基于IPSK的用户协同过滤推荐算法设计 | 第36-38页 |
4.3.1 算法思想描述 | 第36页 |
4.3.2 算法设计描述 | 第36-38页 |
4.4 实验结果与分析 | 第38-40页 |
4.4.1 MovieLens数据集介绍 | 第38-39页 |
4.4.2 实验验证 | 第39-40页 |
4.5 本章小结 | 第40-42页 |
5 电影推荐系统的设计与实现 | 第42-58页 |
5.1 系统功能需求分析 | 第42页 |
5.2 系统概要设计 | 第42-48页 |
5.2.1 系统设计原则 | 第42-43页 |
5.2.2 系统软件架构设计 | 第43-45页 |
5.2.3 系统功能模块设计 | 第45页 |
5.2.4 系统数据库逻辑设计 | 第45-48页 |
5.3 系统开发平台与环境搭建 | 第48-49页 |
5.3.1 系统开发平台 | 第48页 |
5.3.2 系统环境搭建 | 第48-49页 |
5.4 电影推荐系统功能实现 | 第49-56页 |
5.4.1 后台管理系统功能实现 | 第49-52页 |
5.4.2 前台电影推荐系统功能实现 | 第52-56页 |
5.5 系统测试 | 第56-57页 |
5.5.1 功能测试 | 第56-57页 |
5.5.2 非功能测试 | 第57页 |
5.6 本章小结 | 第57-58页 |
6 总结与展望 | 第58-60页 |
6.1 研究工作总结 | 第58页 |
6.2 工作展望 | 第58-60页 |
致谢 | 第60-62页 |
参考文献 | 第62-66页 |
附录 | 第66页 |