中文网页自动分类关键技术研究

第一章引言	第1-9页
·课题的研究背景和意义	第6-7页
·本文研究的主要内容	第7页
·本文的章节安排	第7-9页
第二章自动分类技术概述	第9-15页
·文本自动分类的概念	第9-10页
·文本自动分类的国内外研究现状	第10页
·自动分类算法的分类	第10-12页
·中文网页自动分类的任务	第12-13页
·实现中文网页自动分类的一般过程	第13页
·分类器的性能评价	第13-15页
第三章中文网页的预处理	第15-28页
·中文网页预处理概述	第15页
·中文分词技术	第15-21页
·中文分词概述	第15-16页
·常见的中文分词算法	第16-18页
·中文分词歧义的处理	第18-19页
·未登录词的识别	第19-21页
·特征项的选择方法	第21-24页
·文档频率	第21-22页
·信息增益	第22页
·互信息	第22-23页
·CHI 统计	第23页
·多尺度特征选择方法	第23-24页
·中文网页的表示	第24-28页
·中文网页表示内容的选择	第24-25页
·中文网页表示模型的选择	第25-28页
第四章基于图模型的中文网页自动分类	第28-36页
·基于图模型的文档表示方法	第28-32页
·提出的背景	第28页
·一种新的图模型表示方法	第28-30页
·图模型的性质及相似性度量	第30-32页
·基于图模型的文档分类算法	第32-34页
·基于图模型的分类算法GraphKNN	第33页
·GraphKNN 算法的特点	第33-34页
·图模型与中文网页自动分类实验	第34-36页
·实验内容设置	第34页
·实验结论	第34-36页
第五章基于容噪支持向量机的中文网页自动分类	第36-48页
·支持向量机的原理	第36-40页
·线性可分	第36-38页
·线性不可分	第38页
·支持向量机	第38-39页
·常用的核函数	第39-40页
·支持向量机的训练算法	第40-42页
·训练算法简介	第40页
·序贯最小优化算法	第40-42页
·支持向量机的两个问题	第42-44页
·支持向量机与多类分类问题	第42-43页
·支持向量机的噪声数据问题	第43-44页
·基于容噪的支持向量机算法KNN-SVM	第44-45页
·KNN-SVM 算法的提出	第44-45页
·KNN-SVM 算法性能分析	第45页
·中文网页自动分类实验	第45-48页
·实验内容	第45-46页
·实验结论与分析	第46-48页
第六章结论	第48-49页
·论文总结	第48页
·未来的工作	第48-49页
参考文献	第49-52页
致谢	第52-53页
个人简历	第53页
在读期间已发表和录用的论文	第53页