中文Web文档倾向性自动分类研究
| 1 引言 | 第1-14页 |
| ·相关工作 | 第10-11页 |
| ·我们的贡献 | 第11-14页 |
| 2 问题描述 | 第14-18页 |
| ·系统任务 | 第14-15页 |
| ·性能指标 | 第15-16页 |
| ·阈值选取 | 第16-18页 |
| 3 文本模型--VSM | 第18-37页 |
| ·分词 | 第18-22页 |
| ·分词中的关键问题 | 第19-20页 |
| ·分词算法 | 第20-22页 |
| ·去除停用词 | 第22-23页 |
| ·SCWDSS简介 | 第23-29页 |
| ·模型构造 | 第29-37页 |
| 4 特征选择 | 第37-41页 |
| ·基于互信息的特征选择方法及其实现 | 第37-39页 |
| ·潜在语义索引 | 第39-41页 |
| 5 分类方法 | 第41-61页 |
| ·Naive Bayes方法 | 第42-43页 |
| ·kNN最近邻居法 | 第43-44页 |
| ·决策树方法 | 第44-51页 |
| ·创建决策树(C4.5) | 第46-50页 |
| ·剪枝决策树 | 第50-51页 |
| ·SVM及其在文本分类中的应用 | 第51-59页 |
| ·SVM算法简介 | 第51-56页 |
| ·SVM训练算法研究 | 第56-59页 |
| ·分类方法性能比较 | 第59-61页 |
| 6 实验、性能分析与讨论 | 第61-69页 |
| ·实验文本 | 第62-64页 |
| ·SVM分类性能测试 | 第64-69页 |
| 7 结束语 | 第69-71页 |
| 参考文献 | 第71-75页 |
| 声明 | 第75-76页 |
| 致谢 | 第76页 |