首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于支持向量机与聚类算法的中文文本分类研究

摘要第1-5页
Abstract第5-9页
1 绪论第9-14页
   ·问题的提出及意义第9-10页
   ·研究现状及主要成果第10-11页
   ·本文的主要研究内容第11-14页
2 中文文本分类的相关技术第14-28页
   ·汉语分词词典第15页
   ·汉语分词第15-17页
     ·正向最大匹配分词第16页
     ·反向最大匹配分词第16页
     ·基于统计的词网格分词第16-17页
   ·文档表示模型第17-20页
     ·文档特征第17-18页
     ·文档表示第18-19页
     ·常用的特征词赋权方法第19-20页
   ·特征降维第20-25页
     ·特征词选择第21-23页
     ·特征词析取第23-25页
   ·常用的文本分类方法第25-28页
     ·Rocchio方法——相似度计算方法第25页
     ·K近邻方法第25-26页
     ·贝叶斯方法第26-27页
     ·支持向量机方法第27-28页
3 统计学习理论与支持向量机第28-40页
   ·机器学习的基本问题第28-30页
     ·机器学习问题的表示第28-29页
     ·经验风险最小化第29页
     ·复杂性与推广能力第29-30页
   ·统计学习理论的核心内容第30-32页
     ·VC维定义第30页
     ·推广性的界第30-31页
     ·结构风险最小化第31-32页
   ·支持向量机第32-37页
     ·最优分类超平面第32-33页
     ·线性支持向量机第33-36页
     ·非线性支持向量机第36-37页
   ·用于多类分类的支持向量机第37-40页
     ·一类对余类分类方法第37-38页
     ·成对分类第38-40页
4 聚类算法在支持向量机中的应用第40-52页
   ·聚类算法的概念与分类第40-42页
     ·聚类的概念第40-41页
     ·常用的聚类算法第41-42页
   ·传统的K-均值聚类算法与基于密度概念的K-均值聚类算法第42-45页
     ·传统K-均值算法第42-43页
     ·基于密度概念的K-均值算法第43-45页
   ·聚类算法在支持向量选取中的应用第45-52页
     ·文本向量的规范化处理第46-47页
     ·基于类别信息的两两聚类的支持向量预选取第47-52页
5 实验及结果分析第52-61页
   ·文本分类器常用性能评价指标介绍第52-53页
     ·查准率、查全率和F_1值第52页
     ·微平均和宏平均第52-53页
   ·实验分析第53-61页
     ·中文文本语料预处理第54-56页
     ·文本分类的实现第56-61页
结论第61-63页
参考文献第63-69页
攻读学位期间的主要学术成果第69-70页
致谢第70页

论文共70页,点击 下载论文
上一篇:基于粒子滤波目标跟踪方法研究
下一篇:基于J2EE企业应用框架的研究与应用