基于支持向量机的Web文本分类技术研究

摘要	第1-4页
ABSTRACT	第4-8页
第1章绪论	第8-10页
·课题背景和研究意义	第8页
·课题研究现状	第8-9页
·Web文本挖掘研究现状	第8-9页
·Web文本分类研究现状	第9页
·本文的主要工作和组织结构	第9-10页
第2章中文文本分类技术	第10-22页
·引言	第10页
·文本分类任务描述	第10页
·文本预处理	第10-11页
·中文分词概述	第10-11页
·去停用词	第11页
·文本特征表示	第11-13页
·文本特征选择	第13-15页
·文本频数(document frequency)	第13页
·信息增益(Information Gain)	第13-14页
·期望交叉熵(Expected Cross Entry)	第14页
·互信息(Mutual Information)	第14页
·X-2统计法	第14-15页
·文本特征词权重计算	第15-16页
·本文改进的特征选择和特征权重评估方法	第16-17页
·限定词频	第16-17页
·类间区分度	第17页
·类内区分度	第17页
·几种常用的文本分类算法	第17-19页
·朴素贝叶斯分类方法	第18页
·KNN(K-Nearest-Neighbor)最邻近分类法	第18-19页
·决策树分类算法	第19页
·BP神经网络分类算法	第19页
·文本分类器性能评价指标	第19-22页
第3章支持向量机SVM	第22-32页
·统计学习理论基础	第22-23页
·VC维	第22页
·推广误差的界	第22页
·结构风险最小化原理	第22-23页
·支持向量机SVM	第23页
·支持向量机基本方法	第23-30页
·线性可分情况	第23-25页
·线性不可分情况	第25-26页
·非线性可分情况	第26-27页
·SVM多分类问题	第27-29页
·大规模分类问题支持向量机训练算法	第29-30页
·本文SVM算法分类的具体步骤	第30页
·实验及分析	第30-32页
第4章实验及结果分析	第32-37页
·系统总体结构	第32页
·实验开发环境	第32页
·实现步骤	第32-34页
·特征选择模块	第34-35页
·比较不同的文本分类算法	第35-37页
第5章总结与展望	第37-38页
参考文献	第38-42页
攻读硕士学位期间发表的学术论文	第42-43页
致谢	第43-44页