基于K-Means的垃圾网页检测算法研究

摘要	第4-5页
ABSTRACT	第5-6页
第1章绪论	第9-17页
1.1 研究背景与意义	第9-12页
1.1.1 研究背景	第9-11页
1.1.2 研究意义	第11-12页
1.2 国内外研究现状	第12-14页
1.3 论文主要工作及创新	第14-15页
1.4 论文的组织结构	第15-17页
第2章课题相关理论	第17-27页
2.1 网页排序算法	第17-22页
2.1.1 HITS算法	第17-18页
2.1.2 PageRank算法	第18-20页
2.1.3 TrustRank算法	第20-21页
2.1.4 BadRank算法	第21-22页
2.2 聚类算法	第22-26页
2.2.1 基于划分的聚类	第22-24页
2.2.2 基于层次的聚类	第24-25页
2.2.3 基于密度的聚类	第25-26页
2.2.4 基于网格的聚类	第26页
2.3 本章小结	第26-27页
第3章垃圾网页检测的均值聚类算法	第27-37页
3.1 基于PageRank的差异化网页排序算法IPR	第27-31页
3.1.1 PageRank算法缺点	第27-28页
3.1.2 IPR算法的基本思想	第28-29页
3.1.3 IPR算法的对比实验结果	第29-31页
3.2 基于IPR算法的K-Means算法IPK-Means	第31-35页
3.2.1 K-Means算法缺点	第31-32页
3.2.2 IPK-Means算法	第32-35页
3.3 本章小结	第35-37页
第4章实验与分析	第37-57页
4.1 数据集及评估标准	第37-38页
4.1.1 数据集	第37页
4.1.2 评估标准	第37-38页
4.2 IPR算法对垃圾网页的影响	第38-42页
4.3 IPK-Means算法的聚类分析	第42-53页
4.4 IPK-Means算法检测垃圾网页的实验分析	第53-56页
4.5 本章小结	第56-57页
第5章总结与展望	第57-59页
5.1 总结	第57-58页
5.2 展望	第58-59页
参考文献	第59-65页
发表论文和参加科研情况说明	第65-66页
致谢	第66-67页