中文文本自动分类系统研究—汉语分词及分类器的设计

第一章绪论	第1-17页
·引言	第10-11页
·关键技术	第11-15页
·中文词语分析	第11页
·文本的表示	第11-12页
·特征项的抽取	第12-13页
·分类器的设计	第13-14页
·评价算法	第14-15页
·系统性能评估	第15-16页
·中文文本自动分类系统模型	第16页
·本文的研究内容	第16-17页
第二章汉语自动分词技术研究	第17-46页
·引言	第17-18页
·分词系统实现的基本思想	第18页
·分词系统的基本框架	第18页
·词语粗切分	第18-29页
·基于N-最短路径的非统计粗分模型	第19-21页
·基本思想	第19页
·模型求解	第19-20页
·N-最短路径求解与复杂度分析	第20-21页
·基于N-最短路径的一元统计粗分模型	第21-23页
·基本原理	第21-22页
·一元统计粗分模型的求解与实现	第22-23页
·N-最短路径方法与常用方法的对比分析	第23-24页
·N-最短路径一元统计粗分方法的试验及结果分析	第24-29页
·句子正确粗分的评价标准	第24-25页
·N-最短路径一元统计方法程序实现的类	第25-28页
·N-最短路径一元统计方法及常用方法的粗分试验	第28-29页
·未登录词识别	第29-37页
·数词短语识别	第30-31页
·叠字词识别	第31-32页
·人名、地名、译名的识别	第32-36页
·局部统计量	第32-33页
·候选字段的选择	第33页
·评价函数	第33-34页
·Viterbi算法简介	第34-35页
·信息标注	第35-36页
·识别出的名字概率计算	第36页
·未登录词识别程序实现的类	第36-37页
·未登录词识别的测试	第37页
·词性标注排歧	第37-43页
·隐马尔科夫模型(HMM)简介	第38-39页
·具体实现	第39-41页
·实现的算法	第39页
·片断词性序列的概率计算	第39-40页
·词性标注排歧程序实现的类	第40-41页
·词性标注排歧的测试分析	第41-43页
·汉语自动分词测试系统	第43-46页
第三章分类器的设计	第46-64页
·引言	第46页
·最近中心方法	第46-47页
·Bayes方法	第47页
·KNN方法	第47-48页
·支持向量机方法	第48-64页
·SVM的基本原理	第49-53页
·线性可分	第49-51页
·线性不可分	第51-53页
·分类器的基本设计思想	第53-54页
·分类器的实现	第54-64页
·分类类别的确定	第54-55页
·特征词的抽取	第55-57页
·样本集的特征向量数字化表示	第57-59页
·分类工程文件的生成	第59页
·分类器的训练学习	第59-60页
·分类器的分类测试	第60-61页
·分类测试的结果及分析	第61-64页
第四章总结与展望	第64-66页
·总结	第64-65页
·未来的工作	第65-66页
参考文献	第66-69页
致谢	第69页