首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--计算机网络论文--一般性问题论文

基于支持向量机的Web文本分类技术研究

摘要第1-4页
ABSTRACT第4-8页
第1章 绪论第8-10页
   ·课题背景和研究意义第8页
   ·课题研究现状第8-9页
     ·Web文本挖掘研究现状第8-9页
     ·Web文本分类研究现状第9页
   ·本文的主要工作和组织结构第9-10页
第2章 中文文本分类技术第10-22页
   ·引言第10页
   ·文本分类任务描述第10页
   ·文本预处理第10-11页
     ·中文分词概述第10-11页
     ·去停用词第11页
   ·文本特征表示第11-13页
   ·文本特征选择第13-15页
     ·文本频数(document frequency)第13页
     ·信息增益(Information Gain)第13-14页
     ·期望交叉熵(Expected Cross Entry)第14页
     ·互信息(Mutual Information)第14页
     ·X-2统计法第14-15页
   ·文本特征词权重计算第15-16页
   ·本文改进的特征选择和特征权重评估方法第16-17页
     ·限定词频第16-17页
     ·类间区分度第17页
     ·类内区分度第17页
   ·几种常用的文本分类算法第17-19页
     ·朴素贝叶斯分类方法第18页
     ·KNN(K-Nearest-Neighbor)最邻近分类法第18-19页
     ·决策树分类算法第19页
     ·BP神经网络分类算法第19页
   ·文本分类器性能评价指标第19-22页
第3章 支持向量机SVM第22-32页
   ·统计学习理论基础第22-23页
     ·VC维第22页
     ·推广误差的界第22页
     ·结构风险最小化原理第22-23页
   ·支持向量机SVM第23页
   ·支持向量机基本方法第23-30页
     ·线性可分情况第23-25页
     ·线性不可分情况第25-26页
     ·非线性可分情况第26-27页
     ·SVM多分类问题第27-29页
     ·大规模分类问题支持向量机训练算法第29-30页
   ·本文SVM算法分类的具体步骤第30页
   ·实验及分析第30-32页
第4章 实验及结果分析第32-37页
   ·系统总体结构第32页
   ·实验开发环境第32页
   ·实现步骤第32-34页
   ·特征选择模块第34-35页
   ·比较不同的文本分类算法第35-37页
第5章 总结与展望第37-38页
参考文献第38-42页
攻读硕士学位期间发表的学术论文第42-43页
致谢第43-44页

论文共44页,点击 下载论文
上一篇:基于地震波形的震源类型自动识别研究
下一篇:信息隐藏及其图像恢复算法研究