首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于MapReduce框架的混合推荐算法

摘要第3-4页
Abstract第4页
第1章 绪论第9-12页
    1.1 课题的研究背景及意义第9-10页
    1.2 推荐系统发展概况第10页
        1.2.1 国外的研究现状第10页
        1.2.2 国内的研究现状第10页
    1.3 本文完成的主要工作第10-11页
    1.4 文章结构第11-12页
第2章 推荐系统相关的基本理论第12-23页
    2.1 推荐系统第12页
    2.2 数据和知识资源第12-13页
    2.3 推荐算法第13-15页
    2.4 基于用户的协同过滤算法第15-16页
        2.4.1 建立<物品-评分>矩阵第15页
        2.4.2 寻找用户的最近邻第15页
        2.4.3 产生推荐结果第15-16页
    2.5 基于物品的协同过滤算法第16-17页
        2.5.1 建立相似度矩阵ISM第16页
        2.5.2 建立<用户-评分>矩阵URM第16-17页
        2.5.3 产生推荐结果IRM第17页
    2.6 推荐算法的优化第17-20页
        2.6.1 评分标准化第17-18页
        2.6.2 相似度权重的计算第18页
        2.6.3 近邻的选择第18-20页
    2.7 聚类方法第20页
    2.8 大数据处理工具第20-23页
        2.8.1 Hadoop第20-21页
        2.8.2 HDFS分布式文件系统第21页
        2.8.3 MapReduce第21-23页
第3章 算法改进第23-35页
    3.1 用户特征提取方法第23-24页
        3.1.1 时间类第23页
        3.1.2 评分类第23-24页
        3.1.3 次数类第24页
    3.2 基于MapReduce的k-means算法第24-26页
    3.3 基于物品的协同过滤算法第26-29页
    3.4 基于用户的协同过滤算法第29-32页
    3.5 加入聚类后的基于用户的协同过滤算法第32页
    3.6 结果混合第32-33页
    3.7 预测结果离散化第33-34页
    3.8 针对冷启动问题的一些修改第34-35页
第4章 算法实现及参数优化第35-40页
    4.1 算法实现分析第35-36页
        4.1.1 算法分析——基于物品的协同过滤算法第35-36页
        4.1.2 算法分析——基于用户的协同过滤算法第36页
    4.2 程序运行时间分析第36-37页
    4.3 算法性能优化途径第37-39页
        4.3.1 重复数据的分发问题第37页
        4.3.2 Map结果中的重复数据问题第37页
        4.3.3 聚类后计算组内预测结果需要重复运行程序的问题第37-39页
    4.4 数据的混合比例第39-40页
第5章 实验第40-51页
    5.1 实验数据第40页
    5.2 实验环境配置第40-41页
    5.3 环境搭建第41-43页
        5.3.1 CDH第41页
        5.3.2 配置过程第41-43页
    5.4 评价指标第43-44页
        5.4.1 MAE第43页
        5.4.2 RMSE第43页
        5.4.3 加速比第43-44页
    5.5 实验结果第44-51页
        5.5.1 数据拟合结果与参数选择第44-45页
        5.5.2 实验结果——MAE第45-47页
        5.5.3 实验结果——RMSE第47-49页
        5.5.4 加速比第49-51页
第6章 结论第51-53页
    6.1 结论第51页
    6.2 后续工作第51-53页
致谢第53-54页
参考文献第54-57页
附录第57-63页
作者简介第63页
攻读硕士学位期间研究成果第63页

论文共63页,点击 下载论文
上一篇:法院司法统计报表生成核对系统的设计与实现
下一篇:面向Web Service的自动化测试系统的设计与实现