中文文本自动分类中的关键问题研究

摘要	第1-5页
Abstract	第5-10页
第一章引言	第10-40页
·研究的目的、意义及研究背景	第10-11页
·文本分类的发展过程	第11-12页
·文本分类的定义	第12-13页
·文本分类的步骤	第13-14页
·国际研究现状	第14-37页
·文本标引	第14-15页
·特征降维	第15-22页
·权重计算	第22-24页
·向量规格化	第24-26页
·分类器	第26-33页
·评价标准	第33-36页
·数据集	第36-37页
·国内研究现状	第37-38页
·本论文的研究重点	第38-40页
第二章面向中文文本分类的数据集	第40-45页
·预处理	第40-41页
·分类体系	第41-43页
·类型间的距离	第43-44页
·实验平台	第44-45页
第三章字串特征单位	第45-54页
·N-gram特征集	第46页
·多项式贝叶斯分类器	第46-48页
·实验设计	第48页
·实验结果及分析	第48-52页
·本章小结	第52-54页
第四章特征降维	第54-87页
·特征对分类的作用	第54-56页
·- 特征选择	第56-66页
·与统计量	第56-57页
·统计量	第57-60页
·统计量	第60-61页
·实验设计	第61-63页
·实验结果及分析	第63-66页
·结论	第66页
·提升高度重叠的Bigrams到相应的Trigrams	第66-74页
·重叠的Bigrams	第66-67页
·高度重叠的Bigrams	第67-71页
·实验设计	第71页
·实验结果及分析	第71-73页
·结论	第73-74页
·删除高度偏差的Bigrams	第74-82页
·偏差的Bigrams	第74-77页
·高度偏差的Bigrams	第77-79页
·实验设计	第79页
·实验结果及分析	第79-81页
·结论	第81-82页
·多步降维策略	第82-84页
·多步降维算法	第82-83页
·实验结果及分析	第83-84页
·本章小结	第84-87页
第五章特征权重计算	第87-107页
·数值权重	第87-95页
·权重	第88-90页
·TFEXPCIG权重	第90-91页
·实验设计	第91页
·实验结果及分析	第91-94页
·结论	第94-95页
·Binary权重+数值权重平滑	第95-104页
·Binary权重	第97-98页
·Binary权重+数值权重平滑	第98-99页
·实验设计	第99页
·实验结果及分析	第99-103页
·结论	第103-104页
·本章小结	第104-107页
第六章 Bigram特征与词特征的比较	第107-117页
·正向最大匹配分词	第107-109页
·实验设计	第109页
·实验结果及分析	第109-115页
·本章小结	第115-117页
第七章中文文本分类总体模型	第117-122页
·总体模型	第117-119页
·分类结果	第119-122页
结论	第122-126页
参考文献	第126-137页
致谢	第137页
声明	第137-138页
附录A 基准模型中类型间的相似度	第138-144页
附录B 总体模型中类型间的相似度	第144-151页
个人简历、在学期间的研究成果及发表的学术论文	第151-152页