首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文文本自动分类系统研究—汉语分词及分类器的设计

第一章 绪论第1-17页
   ·引言第10-11页
   ·关键技术第11-15页
     ·中文词语分析第11页
     ·文本的表示第11-12页
     ·特征项的抽取第12-13页
     ·分类器的设计第13-14页
     ·评价算法第14-15页
   ·系统性能评估第15-16页
   ·中文文本自动分类系统模型第16页
   ·本文的研究内容第16-17页
第二章 汉语自动分词技术研究第17-46页
   ·引言第17-18页
   ·分词系统实现的基本思想第18页
   ·分词系统的基本框架第18页
   ·词语粗切分第18-29页
     ·基于N-最短路径的非统计粗分模型第19-21页
       ·基本思想第19页
       ·模型求解第19-20页
       ·N-最短路径求解与复杂度分析第20-21页
     ·基于N-最短路径的一元统计粗分模型第21-23页
       ·基本原理第21-22页
       ·一元统计粗分模型的求解与实现第22-23页
     ·N-最短路径方法与常用方法的对比分析第23-24页
     ·N-最短路径一元统计粗分方法的试验及结果分析第24-29页
       ·句子正确粗分的评价标准第24-25页
       ·N-最短路径一元统计方法程序实现的类第25-28页
       ·N-最短路径一元统计方法及常用方法的粗分试验第28-29页
   ·未登录词识别第29-37页
     ·数词短语识别第30-31页
     ·叠字词识别第31-32页
     ·人名、地名、译名的识别第32-36页
       ·局部统计量第32-33页
       ·候选字段的选择第33页
       ·评价函数第33-34页
       ·Viterbi算法简介第34-35页
       ·信息标注第35-36页
       ·识别出的名字概率计算第36页
     ·未登录词识别程序实现的类第36-37页
     ·未登录词识别的测试第37页
   ·词性标注排歧第37-43页
     ·隐马尔科夫模型(HMM)简介第38-39页
     ·具体实现第39-41页
       ·实现的算法第39页
       ·片断词性序列的概率计算第39-40页
       ·词性标注排歧程序实现的类第40-41页
     ·词性标注排歧的测试分析第41-43页
   ·汉语自动分词测试系统第43-46页
第三章 分类器的设计第46-64页
   ·引言第46页
   ·最近中心方法第46-47页
   ·Bayes方法第47页
   ·KNN方法第47-48页
   ·支持向量机方法第48-64页
     ·SVM的基本原理第49-53页
       ·线性可分第49-51页
       ·线性不可分第51-53页
     ·分类器的基本设计思想第53-54页
     ·分类器的实现第54-64页
       ·分类类别的确定第54-55页
       ·特征词的抽取第55-57页
       ·样本集的特征向量数字化表示第57-59页
       ·分类工程文件的生成第59页
       ·分类器的训练学习第59-60页
       ·分类器的分类测试第60-61页
       ·分类测试的结果及分析第61-64页
第四章 总结与展望第64-66页
   ·总结第64-65页
   ·未来的工作第65-66页
参考文献第66-69页
致   谢第69页

论文共69页,点击 下载论文
上一篇:客户关系管理在会计服务行业的应用探讨
下一篇:光催化降解小分子有机污染物甲醛的研究