首页--语言、文字论文--汉语论文--语义、词汇、词义(训诂学)论文--现代词汇论文

基于特征过滤对比的新词语识别

摘要第1-5页
ABSTRACT第5-6页
目录第6-8页
Contents第8-10页
1 绪论第10-22页
   ·缘起第10页
   ·研究目的及意义第10-11页
     ·研究目的第10页
     ·研究意义第10-11页
   ·研究对象及材料来源第11-13页
     ·研究对象第11-12页
     ·材料来源第12-13页
   ·新词语自动识别的研究概述第13-19页
     ·基于规则的方法第14-15页
     ·基于统计的方法第15-17页
     ·规则与统计相结合的方法第17-19页
     ·新词语识别的难点第19页
   ·本文的研究方法及创新第19-20页
   ·本文的组织安排第20-22页
2 新词语相关分析第22-29页
   ·新词语用字分析第22-24页
   ·新词语的词长分析第24-25页
   ·新词语构成成分的词类分析第25-26页
   ·新词语的构成模式分析第26-28页
   ·本章小结第28-29页
3 基于特征与统计的新词语提取方法第29-44页
   ·基于特征过滤的字符集获取第29-34页
     ·分词碎片和碎片组第29页
     ·语料切分及字符串获取第29-30页
     ·特征碎片及其过滤第30-33页
     ·该方法的实验评测第33-34页
   ·新词语候选集的获取第34-38页
     ·基于参照词库的过滤第34-35页
     ·包含性字符串的归并第35页
     ·基于二元结构的过滤第35-37页
     ·基于规则的候选词语集过滤第37-38页
   ·基于统计模型的新词语识别第38-43页
     ·成词概率第38-40页
     ·汉字构词模式第40-41页
     ·平均互信息第41-43页
   ·本章小结第43-44页
4 系统的设计、实现及实验结果第44-52页
   ·新词语自动提取系统的设计第44-48页
     ·系统设计第44-46页
     ·系统流程图第46-47页
     ·算法描述第47-48页
   ·实验过程及结果测评第48-51页
     ·实验过程第48页
     ·实验测评指标第48-49页
     ·实验结果分析第49-50页
     ·新词语丢失原因分析第50-51页
   ·本章小结第51-52页
5 系统在 2011 年度新词语提取上的应用第52-55页
   ·实验过程第52-53页
   ·实验结果第53-54页
   ·本章小结第54-55页
结论第55-57页
参考文献第57-61页
附录 CUCBst1.0 分词标注系统标记集第61-63页
致谢第63-65页
在读期间发表论文情况第65-66页

论文共66页,点击 下载论文
上一篇:汉语奉承语的语用礼貌原则研究
下一篇:基于面子理论的亲缘关系话语冲突研究