基于统计的Web网页分类算法研究

摘要	第4-5页
Abstract	第5-6页
第一章引言	第9-14页
1.1 研究背景及意义	第9-10页
1.2 国内外研究现状	第10-12页
1.3 研究内容及组织结构	第12-13页
1.4 本章小结	第13-14页
第二章 Web网页分类关键技术	第14-22页
2.1 爬虫技术	第14-15页
2.2 源网页解析	第15-16页
2.3 文本预处理	第16-19页
2.4 特征提取	第19-20页
2.5 向量权重表示	第20页
2.6 文本分类算法	第20-21页
2.7 本章小结	第21-22页
第三章特征提取与权重表示	第22-30页
3.1 特征提取	第22-26页
3.2 特征词权重表示	第26-29页
3.3 本章小结	第29-30页
第四章文本分类算法	第30-41页
4.1 基于统计的文本分类算法	第30-38页
4.2 文本分类系统的评估方法	第38-40页
4.3 本章小结	第40-41页
第五章基于改进特征权重算法的实验设计	第41-55页
5.1 Web网页分类系统框架	第41-45页
5.2 实验设置	第45-49页
5.3 实验结果及分析	第49-52页
5.4 URL过滤模块设计	第52-53页
5.5 本章小结	第53-55页
第六章总结与展望	第55-58页
6.1 工作总结	第55-56页
6.2 工作展望	第56-58页
致谢	第58-59页
参考文献	第59-62页
附录	第62页