基于支持向量机的文本分类问题的研究

致谢	第1-6页
中文摘要	第6-7页
ABSTRACT	第7-8页
序	第8-12页
1 引言	第12-19页
·课题背景	第12-14页
·国内外研究现状	第14-17页
·文本分类	第14-16页
·支持向量机在文本分类中的应用	第16-17页
·本文的研究内容	第17-19页
2 文本表示与特征选择方法对比	第19-38页
·文本分类概述	第19-20页
·基于统计的中文文本自动分类	第20-21页
·向量空间模型(VSM)	第21-23页
·文本特征词的表示	第23-25页
·停用词对文本分类的影响	第23-24页
·性能和可扩展性特征词的权重	第24-25页
·分词	第25-30页
·基于字符串匹配的分词方法	第26-28页
·基于理解的分词方法	第28页
·基于统计的分词方法	第28-30页
·特征选择	第30-37页
·文档频率	第30页
·信息增益	第30-31页
·互信息	第31页
·x~2统计	第31-32页
·基于类内频率的特征选择函数	第32页
·实验结果与分析	第32-37页
·本章小结	第37-38页
3 文本分类方法对比研究	第38-50页
·朴素贝叶斯法(Na(?)ve Bayes)	第38-39页
·KNN方法	第39-40页
·支持向量机方法	第40-48页
·最优分类面	第41-43页
·广义最优分类面	第43页
·规范化超平面集的子集结构	第43-44页
·支持向量机	第44-46页
·内积函数	第46-47页
·实现技术	第47-48页
·实验结果与分析	第48-49页
·本章小结	第49-50页
4 密度聚类在支持向量机中的应用	第50-62页
·常用聚类算法介绍	第50-52页
·模糊 C均值聚类算法(FCM)	第51页
·CURE算法	第51-52页
·DBSCAN算法	第52页
·密度聚类方法在支持向量机中的应用	第52-53页
·支持向量对SVM分类的影响	第52-53页
·各种聚类算法的比较	第53页
·利用密度聚类算法求取边缘点	第53-62页
·密度聚类方法的定义	第54-55页
·DBSCAN算法的不足	第55-56页
·改进的快速密度聚类算法	第56-57页
·参考点数据结构	第57页
·寻找参考点	第57-59页
·提取边缘点	第59页
·算法初始参数的设定	第59-61页
·算法时空复杂度分析	第61-62页
5 文本分类系统的设计与实现	第62-83页
·系统结构	第62-63页
·系统功能	第63-75页
·实验结果与分析	第75-83页
6 结束语	第83-84页
参考文献	第84-88页
附录 A	第88-89页
索引	第89-90页
作者简历	第90-92页
学位论文数据集	第92页