基于支持向量机的文本分类研究

摘要	第4-5页
Abstract	第5页
1 绪论	第8-15页
1.1 研究背景	第8页
1.2 研究意义	第8-10页
1.2.1 理论意义	第8-9页
1.2.2 实践意义	第9-10页
1.3 国内外研究现状	第10-13页
1.3.1 国外研究现状	第10-12页
1.3.2 国内研究现状	第12-13页
1.4 本文的研究内容	第13-14页
1.5 论文的组织结构	第14-15页
2 文本分类概述	第15-26页
2.1 文本分类的框架	第15页
2.2 中文分词	第15-16页
2.3 文本表示	第16-18页
2.4 特征降维	第18-21页
2.4.1 文档频率	第18页
2.4.2 信息增益	第18-19页
2.4.3 互信息	第19-20页
2.4.4 卡方统计	第20-21页
2.5 分类算法	第21-24页
2.5.1 Rocchio算法	第21-22页
2.5.2 朴素贝叶斯分类器	第22-23页
2.5.3 决策树	第23-24页
2.6 文本评估方法	第24页
2.7 本章小结	第24-26页
3 基于SVM与KNN的文本分类比较研究	第26-40页
3.1 机器学习相关概念	第26页
3.2 统计学习理论	第26-28页
3.2.1 统计学习一致性条件	第26-27页
3.2.2 推广性的界	第27-28页
3.2.3 结构风险最小化原则	第28页
3.3 支持向量机	第28-36页
3.3.1 硬间隔支持向量机	第28-30页
3.3.2 软间隔支持向量机	第30-32页
3.3.3 非线性支持向量机	第32-33页
3.3.4 多分类支持向量机	第33-34页
3.3.5 支持向量机的特点	第34-36页
3.4 KNN算法	第36页
3.5 实验	第36-39页
3.5.1 实验环境	第36-37页
3.5.2 数据集	第37页
3.5.3 实验设计	第37页
3.5.4 实验评价	第37-39页
3.6 本章小结	第39-40页
4 基于LSA_SVM的文本分类研究	第40-47页
4.1 同义词和多义词对文本分类的影响	第40-42页
4.2 潜在语义分析	第42页
4.3 奇异值分解	第42-43页
4.4 实验	第43-46页
4.4.1 实验环境	第43-44页
4.4.2 数据集	第44页
4.4.3 实验设计	第44页
4.4.4 实验评价	第44-46页
4.5 本章小结	第46-47页
5 总结与展望	第47-49页
5.1 结论	第47页
5.2 展望	第47-49页
致谢	第49-50页
参考文献	第50-53页
攻读学位期间的研究成果	第53页