中文文本分类方法的研究与实现

摘要	第4-5页
Abstract	第5页
1 绪论	第8-12页
1.1 研究背景与意义	第8-9页
1.2 国内外研究现状	第9-10页
1.3 本文主要工作	第10-11页
1.4 本文的组织结构	第11-12页
2 文本分类技术	第12-26页
2.1 文本分词	第12-14页
2.2 向量空间模型	第14-16页
2.3 文本分类特征选择	第16-19页
2.4 文本分类实现方法	第19-23页
2.5 分类评估	第23-25页
2.6 本章小结	第25-26页
3 基于随机森林的特征选择方法	第26-31页
3.1 随机森林法原理	第26-27页
3.2 随机森林用于特征选择	第27-30页
3.3 本章小结	第30-31页
4 分类算法介绍	第31-38页
4.1 基于临近点的分类方法	第31-34页
4.2 贝叶斯分类	第34-37页
4.3 本章小结	第37-38页
5 实证分析	第38-51页
5.1 文本预处理	第38-41页
5.2 CHI统计与随机森林Boruta算法特征选择	第41-43页
5.3 K近邻法文本分类实证分析	第43-47页
5.4 朴素贝叶斯文本分类实证分析	第47-49页
5.5 基于TF-IDF-VSM的分类模型对比评估	第49-50页
5.6 本章小结	第50-51页
6 总结与展望	第51-53页
致谢	第53-54页
参考文献	第54-58页
附录	第58-60页