首页--语言、文字论文--语言学论文--应用语言学论文

双字低频未登录词识别研究

中文摘要第1-4页
Abstract第4-7页
第一章 引言第7-18页
   ·未登录词自动识别研究意义第7-8页
   ·选题依据第8-18页
     ·低频词的定义第8-10页
     ·未登录低频词研究的意义第10-11页
     ·双字低频未登录词自动识别的意义第11-15页
     ·未登录词研究现状第15-18页
第二章 命名实体自动识别第18-36页
   ·命名实体自动识别的意义第18-19页
   ·最大匹配法和预处理第19-20页
   ·互信息判别法第20-25页
     ·互信息简介第20-22页
     ·基于互信息的未登录词识别实验及分析第22-25页
   ·命名实体自动识别第25-34页
     ·中文姓名识别第25-29页
     ·外国译名的识别第29-33页
     ·中文地名识别研究第33-34页
   ·多字未登录词识别第34-36页
第三章 基于成词概率、互信息、邻字熵的双字低频未登录词判别第36-48页
   ·研究方法、统计量选用说明第36页
   ·垃圾词词表判别第36页
   ·以字成词及非词概率判别第36-37页
   ·互信息、成词非词概率实验及结果分析第37-41页
   ·邻字熵第41-42页
     ·熵的定义第41页
     ·熵的语言学运用第41页
     ·邻字熵算法第41-42页
   ·互信息、成词非词概率、邻字熵实验及结果分析第42-43页
   ·基于素性的双字低频未登录词识别第43-46页
     ·词素和素性第43-44页
     ·词素和素性在计算语言学中的意义第44页
     ·《现代汉语词典》双字词素性标注第44-46页
   ·素性识别双字低频未登录词实验及结果分析第46-48页
     ·素性识别程序算法第46-47页
     ·实验结果及分析第47-48页
第四章 未登录词识别瓶颈——分词不一致问题及解决第48-57页
   ·低频双字词的界定模糊第48页
   ·《信息处理用现代汉语分词规范》的缺陷第48-50页
   ·《信息处理用现代汉语分词规范》与语言学理论的矛盾第50页
   ·语料库中的切分不一致及影响第50-52页
   ·语料库中的切分错误第52-53页
   ·分词规范的修改的建议第53-55页
   ·修改词的定义的理据第55-57页
第五章 基于网络的词判别方法第57-60页
   ·方法说明第57-58页
   ·实验结果及分析第58-60页
结论及展望第60-61页
参考文献第61-67页
致谢第67页

论文共67页,点击 下载论文
上一篇:对张承志小说中苦难的审美解读
下一篇:基于统计的汉语日源词研究