基于统计方法的中文文本自动分类研究

摘要	第1-7页
目录	第7-9页
第一章引言	第9-14页
·课题研究的背景和意义	第9页
·国外研究状况	第9-11页
·国内研究状况	第11-12页
·主要工作与本文的结构	第12-14页
第二章文本自动分类的相关模型	第14-25页
·文本自动分类的定义	第14-15页
·分类常用模型	第15-19页
·向量空间模型(VSM，Vector Space Model)	第15-16页
·潜在语义索引(LSI)模型	第16-19页
·贝叶斯概率模型	第19页
·自动分类常用算法介绍	第19-25页
·中心向量法	第19-20页
·朴素贝叶斯方法(Naive Bayes)	第20-21页
·K-近邻算法(KNN)	第21页
·支持向量机(SVM)	第21-25页
第三章文本自动分类器构造	第25-35页
·文本预处理	第25页
·文本特征描述	第25-28页
·特征提取	第25-28页
·特征重构	第28页
·分类器构造	第28-34页
·训练文本特征项权重计算	第29页
·待分类文本特征项权重计算	第29-30页
·分类器构造算法	第30-34页
·阈值的确定	第34-35页
·文本自动分类系统的结构框架	第35页
第四章实验设置与结果分析	第35-47页
·实验用语料库	第36-37页
·国家语委现代汉语平衡语料库	第36页
·新浪网网页语料	第36-37页
·实验环境	第37页
·实验评测标准	第37-38页
·实验项目	第38页
·实验结果分析	第38-45页
·网页自动分类实验	第45-47页
第五章分类器算法的改进	第47-51页
·改进算法	第47-49页
·实验结果分析	第49-51页
第六章结论与展望	第51-53页
·全文总结	第51-52页
·展望	第52-53页
致谢	第53-54页
硕士阶段参加的课题与发表的论文	第54-55页
参考文献	第55-60页