基于URL特征的网页分类研究
| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 第一章 绪论 | 第8-13页 |
| ·研究背景和意义 | 第8-10页 |
| ·国内外研究现状 | 第10-12页 |
| ·本文主要工作内容 | 第12页 |
| ·论文内容结构 | 第12-13页 |
| 第二章 网页一般分类方法 | 第13-26页 |
| ·传统网页分类的一般方法 | 第13-15页 |
| ·技术背景 | 第13页 |
| ·传统网页分类的一般步骤 | 第13-15页 |
| ·常用的网页特征 | 第15-20页 |
| ·页面特征 | 第16-17页 |
| ·邻居特征 | 第17-20页 |
| 2 3 网页分类算法 | 第20-25页 |
| ·SVM 算法 | 第21-24页 |
| ·改进的LIBSVM 分类算法 | 第24-25页 |
| ·本章小结 | 第25-26页 |
| 第三章 于URL 的网页分类实现 | 第26-45页 |
| ·引言 | 第26-28页 |
| ·传统特征的不足 | 第26页 |
| ·URL 的组成结构 | 第26-28页 |
| ·基于n-gram 的URL 特征提取方法 | 第28-31页 |
| ·常用的URL 特征提取方法及不足 | 第28-29页 |
| ·基于n-gram 的url 特征提取方法 | 第29-30页 |
| ·n-gram 特征与网页正文特征组合方法的实现 | 第30-31页 |
| ·实验及结果分析 | 第31-44页 |
| ·实验数据集构建 | 第31-32页 |
| ·实验分类工具以及评价标准 | 第32-33页 |
| ·实验步骤结果及分析 | 第33-44页 |
| ·本章小结 | 第44-45页 |
| 第四章 总结与展望 | 第45-47页 |
| ·本文完成的工作 | 第45页 |
| ·未来的研究方向 | 第45-47页 |
| 致谢 | 第47-48页 |
| 缩略词 | 第48-49页 |
| 图表清单 | 第49-50页 |
| 参考文献 | 第50-54页 |
| 附 | 第54-56页 |