基于机器学习的文本分类算法研究

摘要	第1-6页
Abstract	第6-9页
目录	第9-11页
第一章绪论	第11-16页
·课题研究背景及意义	第11-12页
·国内外研究现状和发展	第12-14页
·文本分类研究进展	第12-14页
·分类评估标准	第14页
·本文的主要工作和组织结构	第14-16页
·本文的主要工作	第14-15页
·本文的组织结构	第15-16页
第二章文本分类	第16-25页
·文本分类算法概述	第16-17页
·文本表述和特征选择	第17-18页
·文本表述	第17-18页
·特征选择	第18页
·主流文本分类算法	第18-25页
·支持向量机(Support Vector Machine，SVM)	第18-20页
·k最近邻算法(k Nearest Neighbor，kNN)	第20-21页
·决策树算法	第21-23页
·朴素贝叶斯算法(Naive Bayes，NB)	第23-25页
第三章文本分类的评估标准	第25-33页
·常用评估标准	第25-26页
·受试者工作特征曲线(Receive Operating Characteristic Curve，ROC曲线)	第26-27页
·ROC曲线下的区域(The Area Under the ROC Curve，AUC)	第27-30页
·预测精度与AUC	第30-33页
第四章文本分类算法比较实验	第33-49页
·实验设计	第33-34页
·设计动机	第33页
·算法选择	第33-34页
·实验配置	第34-38页
·实验环境	第34-35页
·数据集	第35-38页
·实验数据及分析	第38-47页
·精度分析	第38-41页
·AUC分析	第41-45页
·大容量数据集下的比较	第45-47页
·结论	第47-49页
第五章总结与展望	第49-51页
·工作总结	第49页
·工作展望	第49-51页
参考文献	第51-54页
致谢	第54-55页
攻读硕士学位期间发表的学术论文	第55页