基于Hadoop的推荐算法研究

摘要	第4-5页
Abstract	第5-6页
第1章绪论	第9-15页
1.1 研究背景及意义	第9-10页
1.2 国内外研究现状	第10-11页
1.3 推荐系统可扩展性问题	第11-12页
1.4 本文研究内容	第12页
1.5 本文的组织结构	第12-15页
第2章 Hadoop框架	第15-25页
2.1 HDFS	第16-18页
2.1.1 设计原则	第16-17页
2.1.2 NameNode和DataNode	第17-18页
2.2 MapReduce	第18-23页
2.2.1 MapReduce架构	第18-19页
2.2.2 Input Forma和Output Format	第19-21页
2.2.3 MapReduce执行流程	第21-23页
2.3 本章小结	第23-25页
第3章推荐系统研究	第25-37页
3.1 信息输入模块	第26-27页
3.2 推荐生成模块	第27-33页
3.2.1 协同过滤算法	第27-30页
3.2.2 基于网络结构的推荐算法	第30-33页
3.3 推荐输出模块	第33-35页
3.4 算法扩展性研究	第35页
3.5 本章小结	第35-37页
第4章基于Hadoop的推荐算法设计	第37-57页
4.1 算法流程	第37-40页
4.1.1 不确定性传播算法	第37-39页
4.1.2 全局排序算法	第39页
4.1.3 一种基于项目的协同过滤算法	第39-40页
4.2 不确定性传播算法的MapReduce并行化	第40-53页
4.2.1 度计算	第40-42页
4.2.2 资源转移矩阵计算	第42-49页
4.2.3 推荐矩阵计算	第49-53页
4.3 全局排序算法算法的MapReduce并行化	第53页
4.3.1 推荐结果计算	第53页
4.4 一种基于项目的协同过滤算法的MapReduce并行化	第53-56页
4.4.1 计算共同出现次数	第53-55页
4.4.2 计算相似性矩阵	第55-56页
4.5 本章小结	第56-57页
第5章实验与结果分析	第57-75页
5.1 实验数据	第57页
5.2 实验环境搭建	第57-66页
5.2.1 网络设置	第58-59页
5.2.2 SSH无密码登陆	第59页
5.2.3 参数设置	第59-61页
5.2.4 启动集群	第61-66页
5.3 任务运行优化	第66-68页
5.3.1 任务分析	第66页
5.3.2 任务优化	第66-68页
5.4 实验结果	第68-73页
5.4.1 参数优化结果	第68-69页
5.4.2 命中率	第69-70页
5.4.3 加速比	第70-73页
5.5 本章小结	第73-75页
结论	第75-77页
参考文献	第77-81页
攻读硕士学位期间取得的研究成果	第81-83页
致谢	第83页