基于海量用户行为的推荐算法研究

致谢	第1-6页
中文摘要	第6-7页
ABSTRACT	第7-11页
1 引言	第11-16页
·研究背景与意义	第11-12页
·国内外研究现状	第12-13页
·论文基本内容	第13-14页
·论文基本结构	第14-15页
·本章小结	第15-16页
2 相关理论概述	第16-29页
·Hadoop分布式平台	第16-21页
·HDFS	第16-18页
·MapReduce	第18-19页
·Hadoop基本架构	第19-21页
·逆向最大匹配中文分词算法	第21-22页
·文本相似性	第22-23页
·朴素贝叶斯分类算法	第23-25页
·User-Based协同过滤推荐算法	第25-28页
·用户相似度计算	第25-26页
·预测打分	第26页
·产生推荐结果	第26页
·举例说明	第26-28页
·User-Based推荐算法中存在的问题	第28页
·本章小结	第28-29页
3 并行化User-Based推荐算法设计	第29-43页
·算法总体设计思路	第29-32页
·应用场景分析	第29页
·算法技术选型	第29-32页
·算法详细设计思路	第32-42页
·算法整体结构	第32-34页
·算法各模块功能详述	第34-42页
·本章小结	第42-43页
4 并行化User-Based推荐算法实现	第43-65页
·算法整体流程	第43-45页
·各模块实现方式详述	第45-64页
·原始日志清洗、格式化与基本统计模块	第46-51页
·构建用户兴趣向量模块	第51-53页
·用户相似度计算模块	第53-54页
·用户对项目预测评分模块	第54-56页
·项目点击Top-N模块	第56-58页
·文本相似性计算模块	第58-59页
·推荐结果生成模块	第59-61页
·网页抓取模块	第61-62页
·逆向最大匹配中文分词模块	第62-64页
·朴素贝叶斯文本分类模块	第64页
·本章小结	第64-65页
5 实验与分析	第65-75页
·实验环境	第65-69页
·服务器及Hadoop集群部署情况	第65-66页
·Hadoop集群配置	第66-69页
·实验数据说明	第69-70页
·实验设计方案	第70-71页
·实验结果评估标准	第70-71页
·训练数据与测试数据	第71页
·实验结果分析	第71-74页
·算法运行效率实验	第71-73页
·算法推荐结果准确性实验	第73-74页
·本章小结	第74-75页
6 总结与展望	第75-77页
参考文献	第77-79页
作者简历	第79-81页
学位论文数据集	第81页