摘要 | 第1-6页 |
Abstract | 第6-7页 |
第一章 绪论 | 第7-11页 |
·介绍 | 第7-8页 |
·本文工作 | 第8-9页 |
·基于网页质量的PageRank算法简介 | 第8页 |
·基于链接结构分析的垃圾网页过滤算法简介 | 第8-9页 |
·论文组织结构 | 第9-11页 |
第二章 背景知识与相关工作 | 第11-20页 |
·背景知识 | 第11-17页 |
·WEB图模型 | 第11-12页 |
·HITS算法 | 第12-13页 |
·PageRank算法 | 第13-14页 |
·其它相关算法 | 第14-17页 |
·相关工作 | 第17-20页 |
·Web Spam | 第17页 |
·Web Spam 主要作弊方法 | 第17-18页 |
·Link Spam识别与过滤 | 第18-20页 |
第三章 基于网页质量的PageRank算法 | 第20-25页 |
·算法思想 | 第20-21页 |
·网页相对质量 | 第21-22页 |
·QPR算法 | 第22-23页 |
·QPR算法运行示例 | 第23-24页 |
·算法效率分析 | 第24-25页 |
第四章 基于链接分析的spam网页过滤 | 第25-30页 |
·算法思想 | 第25页 |
·网页链接结构相似性度量 | 第25-26页 |
·基于链接结构相似性分析的spam网页过滤算法 | 第26-30页 |
·网页相似性聚类 | 第26-28页 |
·Spam Link 降权 | 第28-29页 |
·Spam 过滤 | 第29-30页 |
第五章 实验 | 第30-43页 |
·实验数据 | 第30-31页 |
数据集一:主题相关的抓取集 | 第30页 |
数据集二:基于查询抓取集 | 第30页 |
数据集三:标准测试数据集UK2006,UK2007 | 第30-31页 |
·QPR 算法实验验证 | 第31-37页 |
·评估标准 | 第31页 |
·排序结果评估标准 | 第31-32页 |
·实验结果 | 第32-37页 |
·基于链接分析的spam网页过滤 | 第37-43页 |
·聚类结果分析 | 第37-40页 |
·Spam页面过滤 | 第40-43页 |
第六章 总结与展望 | 第43-45页 |
·Page Quality Based PageRank算法总结 | 第43页 |
·基于链接结构分析的spam网页过滤算法总结 | 第43-44页 |
·未来工作展望 | 第44-45页 |
参考文献 | 第45-48页 |
硕士期间发表论文 | 第48-49页 |
致谢 | 第49-50页 |