基于关联的中文文本分类系统的设计与实现

目录	第1-7页
摘要	第7-8页
ABSTRACT	第8-10页
第一章引言	第10-19页
·文本自动分类的发展及应用	第10-11页
·文本自动分类的提出	第10页
·文本自动分类的发展与应用	第10-11页
·文本分类及其相关技术理论	第11-13页
·文本分类需要解决的问题	第11-12页
·文本自动分类的关键技术	第12-13页
·文本分类目前存在的问题	第13-16页
·分词技术面临的难题	第14-15页
·特征抽取过程中存在的问题	第15-16页
·分类器存在的问题	第16页
·本论文的主要工作及创新点	第16-18页
·本论文的主要工作	第16-17页
·本论文的创新点	第17-18页
·论文组织	第18-19页
第二章中文文本自动分类模型体系	第19-30页
·中文文本分类的体系框架	第19-20页
·中文自动分词的主要理论技术	第20-23页
·基于字符串匹配的分词方法	第21-22页
·基于理解的分词方法	第22页
·基于统计的分词方法	第22-23页
·几种典型的自动分词系统	第23页
·特征提取算法的主要理论技术	第23-25页
·信息增益	第24-25页
·互信息	第25页
·X~2估计	第25页
·文本分类器的主要理论技术	第25-29页
·支持向量机法	第26-27页
·K-近邻法	第27-28页
·贝叶斯分类方法	第28-29页
·其它分类器	第29页
·本章小结	第29-30页
第三章基于关联的中文文本自动分类关键算法研究	第30-60页
·基于HASH函数的高效中文自动分词算法	第30-31页
·词表的建立	第30页
·算法思想	第30-31页
·歧义识别	第31页
·基于关联分组最优树文本特征抽取方法	第31-44页
·词级关联分组结构图	第32-33页
·WordNet词表的实现	第33-39页
·WordNet的概述	第33-34页
·WordNet的设计思想	第34-37页
·中文WordNet的实现	第37-39页
·WordNet的评价	第39页
·基于关联分组最优树的建立	第39-43页
·词级关联分组的生成	第39-40页
·最优树的生成	第40-41页
·特征矩阵的建立	第41-42页
·综合评价	第42-43页
·实验与结果	第43-44页
·贝叶斯分类器	第44-59页
·贝叶斯判别标准	第44-46页
·贝叶斯判别效果和判别能力的检验	第46-51页
·均值向量和协方差矩阵的估计值	第46-48页
·两个文本样本之间差异的显著性检验	第48-49页
·多个文本样本判别效果的检验	第49-50页
·各变量的相对判别能力	第50-51页
·贝叶斯分类过程	第51-55页
·逐步选入变量	第52-53页
·及时剔除变量	第53-54页
·判别分类	第54-55页
·实验与结果	第55-59页
·本章小结	第59-60页
第四章基于关联的分类系统的实现与性能分析	第60-70页
·分类系统的实现	第60-64页
·分类系统的训练	第60-64页
·分类系统中分类器的实现	第64页
·分类系统的性能比较分析	第64-69页
·实验与结果	第65-68页
·系统性能分析	第68-69页
·本章小结	第69-70页
第五章结束语	第70-72页
·工作总结	第70-71页
·有待进一步研究的工作	第71-72页
致谢	第72-73页
参考文献	第73-77页
附研究生在读研期间的科研经历	第77页