基于多类的汉语文本自动分类研究

摘要	第1-5页
ABSTRACT	第5-6页
第一章绪论	第6-17页
·文档自动分类概述	第6-8页
·文本自动分类的原理	第8-10页
·基于机器学习的文本分类方法	第10-12页
·汉语文本自动分类的特殊性及处理方法	第12-15页
·本文的主要内容及结构	第15-17页
第二章汉语训练文本的预处理	第17-27页
·基于词典的汉语文本自动分词	第17-19页
·基于EM算法的中文文本自动分词	第19-21页
·分词中的歧义字段的处理	第21-23页
·训练文本特征提取-降维(TSR)	第23-27页
第三章基于多类的汉语文本分类-模糊模式识别方法	第27-34页
·机器学习和文本分类	第27-28页
·模糊模式识别原理	第28-29页
·文本的特征表示	第29-31页
·模糊C-原型算法	第31-34页
第四章基于多类的汉语文本分类-BOOSTING方法	第34-42页
·文本分类器组方法:BOOSTING训练算法	第34-37页
·弱分类器的选择	第37-38页
·改进的BOOSTING算法-ADABOOST.MH~(KR)算法	第38-40页
·待分类文本的分类	第40-42页
第五章两种文本分类方法的性能测试和比较	第42-47页
·分类性能测试评估方法	第42-43页
·测试数据源	第43-44页
·分类器学习及分类测试结果	第44-45页
·两种分类方法性能比较	第45-47页
第六章基于多类的智能信息处理系统	第47-55页
·课题背景及系统功能描述	第47-51页
·系统总体结构和实现原理	第51-52页
·基于多类的文本自动分类模块的实现	第52-54页
·分类实验结果	第54-55页
结束语	第55-57页
致谢	第57-58页
参考文献	第58-60页