首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

互联网中的海量用户行为挖掘算法研究

摘要第1-5页
ABSTRACT第5-9页
第1章 绪论第9-12页
   ·研究背景第9-10页
   ·本文工作第10-11页
   ·本文结构安排第11-12页
第2章 用户行为挖掘与分布式运算背景知识第12-29页
   ·数据挖掘以及 Web 挖掘基础知识第12-16页
     ·数据挖掘第12-14页
     ·Web 挖掘第14-16页
   ·本文涉及的数据挖掘算法第16-19页
     ·聚类分析概述第16页
     ·聚类分析中的距离与相似度度量第16-18页
     ·聚类结果评价第18-19页
   ·互联网中的用户行为第19-23页
     ·社会化标记系统中的用户行为第19-21页
     ·搜索引擎中的用户行为第21-23页
   ·MapReduce 相关技术介绍第23-27页
     ·背景第24页
     ·编程模式第24-25页
     ·实现框架第25-27页
   ·本章小结第27-29页
第3章 社会化标记系统中的用户标签聚类算法第29-42页
   ·概述第29页
   ·基于标签共现的聚类算法第29-30页
   ·基于对象特征向量表示法的标签聚类算法第30-33页
     ·标签的向量表示第30-32页
     ·标签的相似度计算第32页
     ·标签聚类第32-33页
   ·实验结果及分析第33-39页
     ·数据集第33-34页
     ·衡量标准第34-35页
     ·k 值的确定第35-36页
     ·实验结果第36-39页
   ·算法在实际系统中的应用第39-41页
     ·Liser 系统简介第39-40页
     ·算法在Liser 系统中的应用第40-41页
   ·本章小结第41-42页
第4章 搜索引擎中的海量用户查询词聚类算法第42-59页
   ·概述第42页
   ·用户查询词建模第42-45页
     ·搜索引擎日志数据格式第42-43页
     ·user-query-URL 三部图模型第43-44页
     ·查询词的特征向量表示及相似度计算第44-45页
   ·聚类算法的MapReduce 化第45-49页
     ·K-Means 算法第45页
     ·基于MapReduce 的并行K-Means 算法第45-49页
   ·算法的可扩展性研究第49-53页
     ·计算复杂度的削减第49-50页
     ·类中心向量表的压缩第50-53页
   ·实验结果及分析第53-58页
     ·数据集及实验环境第53页
     ·实验评价标准第53页
     ·聚类实验迭代收敛的确定第53-54页
     ·实验参数的确定第54-55页
     ·实验分析第55-58页
   ·本章小结第58-59页
第5章 总结与展望第59-61页
   ·全文总结第59-60页
   ·工作展望第60-61页
参考文献第61-65页
致谢第65-66页
在读期间发表的学术论文与取得的研究成果第66页

论文共66页,点击 下载论文
上一篇:互联网中内容分发算法的研究
下一篇:个性化服务中基于Tag的用户模型研究