互联网噪链的识别过滤及其在Web Spam研究上的应用

目录	第1-5页
摘要	第5-6页
ABSTRACT	第6-7页
第一章绪论	第7-10页
·研究背景	第7-8页
·本文工作	第8-9页
·论文的组织结构	第9-10页
第二章背景知识和相关工作	第10-18页
·背景知识	第10-11页
·Web图模型	第10页
·基于链接的排序算法	第10-11页
·相关工作	第11-18页
·噪链(Noisy Link)	第11-13页
·Web Spam	第13-15页
·Link Spam	第15-18页
第三章自动识别与过滤噪链	第18-25页
·启发	第18-19页
·聚类	第19-22页
·相似度	第19-20页
·聚类思路	第20-21页
·聚类伪码	第21-22页
·复杂度分析	第22页
·噪链过滤	第22-25页
·过滤思路	第22-23页
·过滤算法	第23-25页
第四章实验数据与分析	第25-33页
·数据集	第25页
·评价方法	第25-26页
·实验结果	第26-33页
·聚类	第26-27页
·过滤噪链	第27-33页
第五章 WEB SPAM过滤应用	第33-45页
·数据集	第33-34页
·比较算法	第34-35页
·评价方法	第35页
·实验结果	第35-45页
·比较结果	第35-38页
·聚类结果	第38-40页
·过滤分析	第40-41页
·相似度度量影响	第41-45页
第六章总结与展望	第45-47页
附录一硕士期间发表的论文	第47-48页
附录二第五章TRUSTRANK使用的种子站点数据	第48-49页
参考文献	第49-52页
致谢	第52-53页