互联网中的海量用户行为挖掘算法研究

摘要	第1-5页
ABSTRACT	第5-9页
第1章绪论	第9-12页
·研究背景	第9-10页
·本文工作	第10-11页
·本文结构安排	第11-12页
第2章用户行为挖掘与分布式运算背景知识	第12-29页
·数据挖掘以及 Web 挖掘基础知识	第12-16页
·数据挖掘	第12-14页
·Web 挖掘	第14-16页
·本文涉及的数据挖掘算法	第16-19页
·聚类分析概述	第16页
·聚类分析中的距离与相似度度量	第16-18页
·聚类结果评价	第18-19页
·互联网中的用户行为	第19-23页
·社会化标记系统中的用户行为	第19-21页
·搜索引擎中的用户行为	第21-23页
·MapReduce 相关技术介绍	第23-27页
·背景	第24页
·编程模式	第24-25页
·实现框架	第25-27页
·本章小结	第27-29页
第3章社会化标记系统中的用户标签聚类算法	第29-42页
·概述	第29页
·基于标签共现的聚类算法	第29-30页
·基于对象特征向量表示法的标签聚类算法	第30-33页
·标签的向量表示	第30-32页
·标签的相似度计算	第32页
·标签聚类	第32-33页
·实验结果及分析	第33-39页
·数据集	第33-34页
·衡量标准	第34-35页
·k 值的确定	第35-36页
·实验结果	第36-39页
·算法在实际系统中的应用	第39-41页
·Liser 系统简介	第39-40页
·算法在Liser 系统中的应用	第40-41页
·本章小结	第41-42页
第4章搜索引擎中的海量用户查询词聚类算法	第42-59页
·概述	第42页
·用户查询词建模	第42-45页
·搜索引擎日志数据格式	第42-43页
·user-query-URL 三部图模型	第43-44页
·查询词的特征向量表示及相似度计算	第44-45页
·聚类算法的MapReduce 化	第45-49页
·K-Means 算法	第45页
·基于MapReduce 的并行K-Means 算法	第45-49页
·算法的可扩展性研究	第49-53页
·计算复杂度的削减	第49-50页
·类中心向量表的压缩	第50-53页
·实验结果及分析	第53-58页
·数据集及实验环境	第53页
·实验评价标准	第53页
·聚类实验迭代收敛的确定	第53-54页
·实验参数的确定	第54-55页
·实验分析	第55-58页
·本章小结	第58-59页
第5章总结与展望	第59-61页
·全文总结	第59-60页
·工作展望	第60-61页
参考文献	第61-65页
致谢	第65-66页
在读期间发表的学术论文与取得的研究成果	第66页