基于特征过滤对比的新词语识别

摘要	第1-5页
ABSTRACT	第5-6页
目录	第6-8页
Contents	第8-10页
1 绪论	第10-22页
·缘起	第10页
·研究目的及意义	第10-11页
·研究目的	第10页
·研究意义	第10-11页
·研究对象及材料来源	第11-13页
·研究对象	第11-12页
·材料来源	第12-13页
·新词语自动识别的研究概述	第13-19页
·基于规则的方法	第14-15页
·基于统计的方法	第15-17页
·规则与统计相结合的方法	第17-19页
·新词语识别的难点	第19页
·本文的研究方法及创新	第19-20页
·本文的组织安排	第20-22页
2 新词语相关分析	第22-29页
·新词语用字分析	第22-24页
·新词语的词长分析	第24-25页
·新词语构成成分的词类分析	第25-26页
·新词语的构成模式分析	第26-28页
·本章小结	第28-29页
3 基于特征与统计的新词语提取方法	第29-44页
·基于特征过滤的字符集获取	第29-34页
·分词碎片和碎片组	第29页
·语料切分及字符串获取	第29-30页
·特征碎片及其过滤	第30-33页
·该方法的实验评测	第33-34页
·新词语候选集的获取	第34-38页
·基于参照词库的过滤	第34-35页
·包含性字符串的归并	第35页
·基于二元结构的过滤	第35-37页
·基于规则的候选词语集过滤	第37-38页
·基于统计模型的新词语识别	第38-43页
·成词概率	第38-40页
·汉字构词模式	第40-41页
·平均互信息	第41-43页
·本章小结	第43-44页
4 系统的设计、实现及实验结果	第44-52页
·新词语自动提取系统的设计	第44-48页
·系统设计	第44-46页
·系统流程图	第46-47页
·算法描述	第47-48页
·实验过程及结果测评	第48-51页
·实验过程	第48页
·实验测评指标	第48-49页
·实验结果分析	第49-50页
·新词语丢失原因分析	第50-51页
·本章小结	第51-52页
5 系统在 2011 年度新词语提取上的应用	第52-55页
·实验过程	第52-53页
·实验结果	第53-54页
·本章小结	第54-55页
结论	第55-57页
参考文献	第57-61页
附录 CUCBst1.0 分词标注系统标记集	第61-63页
致谢	第63-65页
在读期间发表论文情况	第65-66页