半监督自训练分类模型的研究与实现
| 摘要 | 第1-5页 |
| Abstract | 第5-8页 |
| 1 绪论 | 第8-12页 |
| ·研究背景与意义 | 第8页 |
| ·研究进展 | 第8-10页 |
| ·本文的工作 | 第10页 |
| ·本文的章节安排 | 第10-12页 |
| 2 文本分类相关技术 | 第12-20页 |
| ·文本预处理 | 第12-13页 |
| ·中文分词 | 第12-13页 |
| ·文本表示 | 第13-16页 |
| ·特征降维 | 第16-20页 |
| ·文档频率 | 第17页 |
| ·信息增益 | 第17页 |
| ·χ~2统计法 | 第17-18页 |
| ·互信息 | 第18-20页 |
| 3 基分类器的选取 | 第20-33页 |
| ·K近邻法 | 第21-22页 |
| ·Naive Bayes分类算法 | 第22-26页 |
| ·支持向量机方法 | 第26-28页 |
| ·选取高性能算法 | 第28-33页 |
| 4 改进的半监督自训练分类模型 | 第33-44页 |
| ·半监督分类研究现状 | 第34-36页 |
| ·自训练分类算法 | 第36-37页 |
| ·基于最近邻规则的数据剪辑技术 | 第37页 |
| ·自训练分类算法的改进 | 第37-38页 |
| ·实验与分析 | 第38-44页 |
| 5 改进的Tri-Training分类模型 | 第44-56页 |
| ·Tri-Training分类算法 | 第45-46页 |
| ·Tri-Training分类模型改进与实现 | 第46-48页 |
| ·实验与分析 | 第48-56页 |
| 结论 | 第56-58页 |
| 参考文献 | 第58-60页 |
| 攻读硕士学位期间发表学术论文情况 | 第60-61页 |
| 致谢 | 第61-62页 |