首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--检索机论文

基于Mahout协同过滤算法在KDD2010比赛中的探索研究

摘要第5-6页
ABSTRACT第6-7页
第一章 绪论第10-16页
    1.1 选题背景第10-12页
        1.1.1 关于教育数据挖掘第10-11页
        1.1.2 关于协同过滤技术第11-12页
    1.2 选题目的和意义第12-14页
    1.3 论文结构第14-16页
第二章 相关理论概述第16-38页
    2.1 基本概念第16-17页
        2.1.1 数据挖掘与机器学习第16页
        2.1.2 数据和数据集第16-17页
    2.2 预处理第17-21页
    2.3 数据挖掘的常用算法第21-24页
        2.3.1 分类与回归第21-23页
        2.3.2 聚类分析第23页
        2.3.3 关联分析第23-24页
    2.4 Apache Mahout介绍第24-26页
    2.5 协同过滤推荐算法第26-38页
        2.5.1 基于用户的协同过滤推荐算法第26-28页
        2.5.2 基于项目的协同过滤推荐算法第28-29页
        2.5.3 基于SVD的协同过滤推荐算法第29-31页
        2.5.4 相似度计算方法分析第31-33页
        2.5.5 协同过滤算法的特点第33-38页
第三章 预处理过程第38-46页
    3.1 问题定义与数据集分析第38-40页
        3.1.1 KDD Cup 2010比赛命题第38-39页
        3.1.2 对相关特征数据的统计第39-40页
    3.2 数据集抽取第40-46页
        3.2.1 抽取方法第40-42页
        3.2.2 数据清理第42-46页
第四章 实验的设计与效果评估第46-58页
    4.1 算法评估第46页
    4.2 基于Apache Mahout的算法实验第46-58页
        4.2.1 基于用户的协同过滤推荐(User-Based CF)第48-49页
        4.2.2 基于项目的协同过滤推荐(Item-Based CF)第49-50页
        4.2.3 基于SVD的协同过滤推荐(SVD-Based CF)第50-51页
        4.2.4 三种相似度的计算方法第51-56页
        4.2.5 实验结论第56-58页
第五章 总结与体会第58-60页
    5.1 论文主要工作总结第58-59页
    5.2 今后所要开展工作第59-60页
致谢第60-61页
参考文献第61-64页
附录A 攻读硕士期间发表论文以及软件著作权第64页

论文共64页,点击 下载论文
上一篇:相似性度量及其在图像非局部滤波中的应用研究
下一篇:多标记中文问句分类研究多标记中文问句