利用相关机器学习算法实现新闻分类

摘要	第4-5页
Abstract	第5-6页
1 绪论	第9-14页
1.1 研究背景及意义	第9-10页
1.2 国内外研究现状	第10-12页
1.3 研究的主要内容	第12页
1.4 论文的组织结构	第12-14页
2 文本数据预处理及相关技术	第14-23页
2.1 文本分类概述	第14-15页
2.2 文本分类具体流程	第15-16页
2.3 清除噪声数据	第16页
2.4 文本分词	第16-17页
2.5 去停用词	第17页
2.6 文本的表示模式	第17-19页
2.7 特征表示及特征降维	第19-23页
3 应用于的分类的机器学习算法及检验指标	第23-31页
3.1 支持向量机(SupportVectorMachine)	第23-27页
3.2 朴素贝叶斯(NaiveBayes)	第27-28页
3.3 随机森林(RandomForest)	第28-29页
3.4 分类效果检验指标	第29-31页
4 完整的中文新闻分类系统实现	第31-36页
4.1 运行环境	第31页
4.2 数据预处理	第31-34页
4.3 结果分析	第34-36页
5 总结及展望	第36-40页
5.1 总结	第36-38页
5.2 展望	第38-40页
致谢	第40-41页
参考文献	第41-44页