中文Web文档倾向性自动分类研究
1 引言 | 第1-14页 |
·相关工作 | 第10-11页 |
·我们的贡献 | 第11-14页 |
2 问题描述 | 第14-18页 |
·系统任务 | 第14-15页 |
·性能指标 | 第15-16页 |
·阈值选取 | 第16-18页 |
3 文本模型--VSM | 第18-37页 |
·分词 | 第18-22页 |
·分词中的关键问题 | 第19-20页 |
·分词算法 | 第20-22页 |
·去除停用词 | 第22-23页 |
·SCWDSS简介 | 第23-29页 |
·模型构造 | 第29-37页 |
4 特征选择 | 第37-41页 |
·基于互信息的特征选择方法及其实现 | 第37-39页 |
·潜在语义索引 | 第39-41页 |
5 分类方法 | 第41-61页 |
·Naive Bayes方法 | 第42-43页 |
·kNN最近邻居法 | 第43-44页 |
·决策树方法 | 第44-51页 |
·创建决策树(C4.5) | 第46-50页 |
·剪枝决策树 | 第50-51页 |
·SVM及其在文本分类中的应用 | 第51-59页 |
·SVM算法简介 | 第51-56页 |
·SVM训练算法研究 | 第56-59页 |
·分类方法性能比较 | 第59-61页 |
6 实验、性能分析与讨论 | 第61-69页 |
·实验文本 | 第62-64页 |
·SVM分类性能测试 | 第64-69页 |
7 结束语 | 第69-71页 |
参考文献 | 第71-75页 |
声明 | 第75-76页 |
致谢 | 第76页 |