基于支持向量机的中文网页自动分类技术研究

摘要	第1-5页
Abstract	第5-9页
1 绪论	第9-12页
·选题背景及意义	第9-10页
·网页自动分类研究现状	第10页
·网页分类的难点及突出问题	第10-11页
·本文工作及内容安排	第11-12页
2 文本分类的基础理论与相关技术	第12-20页
·文本分类的基本概念	第12-13页
·文本表示模型	第13-15页
·文本分类算法	第15-18页
·向量距离分类法	第15-16页
·贝叶斯算法	第16-17页
·KNN算法	第17页
·支持向量机	第17-18页
·文本分类的体系评价	第18-20页
3 中文网页信息的自动提取	第20-36页
·中文网页自动分类的任务	第20-21页
·网页基本结构与特点	第21-22页
·网页的基本结构	第21-22页
·网页特点分析	第22页
·中文分词技术	第22-32页
·常见的中文分词法	第23-24页
·最大匹配分词法( MAXIMUM MATCHING METHOD , MM法)	第24-26页
·改进的最大匹配分词法	第26-31页
·中文分词歧义的处理	第31-32页
·未登录词的识别	第32页
·特征项的选择方法	第32-36页
4 支持向量机的研究	第36-51页
·统计学习理论	第36-40页
·背景及发展	第36-37页
·统计学习理论的核心内容	第37-40页
·支持向量机	第40-47页
·支持向量机的应用	第40-41页
·支持向量机分类	第41-47页
·支持向量机的训练算法	第47-50页
·训练算法简介	第47-48页
·序贯最小优化算法	第48-50页
·算法评估	第50-51页
5 支持向量机的扩展、容噪	第51-62页
·单分类器融合成多分类器	第51-52页
·支持向量机的多类文本分类方法	第52-54页
·样本选择方案	第52页
·训练方案	第52-54页
·网页的链接信息	第54-57页
·链接的种类	第55-56页
·链接的噪音	第56-57页
·链接的利用	第57页
·基于容噪的支持向量机算法KNN-SVM	第57-59页
·SVM和KNN之间的联系	第57-58页
·KNN-SVM算法的提出	第58页
·KNN-SVM算法	第58-59页
·KNN-SVM算法分析	第59页
·中文网页自动分类实验	第59-62页
6 结论与展望	第62-64页
·全文总结	第62页
·对未来的工作展望	第62-64页
参考文献	第64-68页
攻读硕士学位期间发表的论文及所取得的研究成果	第68-69页
致谢	第69页