基于URL特征的网页分类研究
摘要 | 第1-5页 |
Abstract | 第5-8页 |
第一章 绪论 | 第8-13页 |
·研究背景和意义 | 第8-10页 |
·国内外研究现状 | 第10-12页 |
·本文主要工作内容 | 第12页 |
·论文内容结构 | 第12-13页 |
第二章 网页一般分类方法 | 第13-26页 |
·传统网页分类的一般方法 | 第13-15页 |
·技术背景 | 第13页 |
·传统网页分类的一般步骤 | 第13-15页 |
·常用的网页特征 | 第15-20页 |
·页面特征 | 第16-17页 |
·邻居特征 | 第17-20页 |
2 3 网页分类算法 | 第20-25页 |
·SVM 算法 | 第21-24页 |
·改进的LIBSVM 分类算法 | 第24-25页 |
·本章小结 | 第25-26页 |
第三章 于URL 的网页分类实现 | 第26-45页 |
·引言 | 第26-28页 |
·传统特征的不足 | 第26页 |
·URL 的组成结构 | 第26-28页 |
·基于n-gram 的URL 特征提取方法 | 第28-31页 |
·常用的URL 特征提取方法及不足 | 第28-29页 |
·基于n-gram 的url 特征提取方法 | 第29-30页 |
·n-gram 特征与网页正文特征组合方法的实现 | 第30-31页 |
·实验及结果分析 | 第31-44页 |
·实验数据集构建 | 第31-32页 |
·实验分类工具以及评价标准 | 第32-33页 |
·实验步骤结果及分析 | 第33-44页 |
·本章小结 | 第44-45页 |
第四章 总结与展望 | 第45-47页 |
·本文完成的工作 | 第45页 |
·未来的研究方向 | 第45-47页 |
致谢 | 第47-48页 |
缩略词 | 第48-49页 |
图表清单 | 第49-50页 |
参考文献 | 第50-54页 |
附 | 第54-56页 |