双字低频未登录词识别研究

中文摘要	第1-4页
Abstract	第4-7页
第一章引言	第7-18页
·未登录词自动识别研究意义	第7-8页
·选题依据	第8-18页
·低频词的定义	第8-10页
·未登录低频词研究的意义	第10-11页
·双字低频未登录词自动识别的意义	第11-15页
·未登录词研究现状	第15-18页
第二章命名实体自动识别	第18-36页
·命名实体自动识别的意义	第18-19页
·最大匹配法和预处理	第19-20页
·互信息判别法	第20-25页
·互信息简介	第20-22页
·基于互信息的未登录词识别实验及分析	第22-25页
·命名实体自动识别	第25-34页
·中文姓名识别	第25-29页
·外国译名的识别	第29-33页
·中文地名识别研究	第33-34页
·多字未登录词识别	第34-36页
第三章基于成词概率、互信息、邻字熵的双字低频未登录词判别	第36-48页
·研究方法、统计量选用说明	第36页
·垃圾词词表判别	第36页
·以字成词及非词概率判别	第36-37页
·互信息、成词非词概率实验及结果分析	第37-41页
·邻字熵	第41-42页
·熵的定义	第41页
·熵的语言学运用	第41页
·邻字熵算法	第41-42页
·互信息、成词非词概率、邻字熵实验及结果分析	第42-43页
·基于素性的双字低频未登录词识别	第43-46页
·词素和素性	第43-44页
·词素和素性在计算语言学中的意义	第44页
·《现代汉语词典》双字词素性标注	第44-46页
·素性识别双字低频未登录词实验及结果分析	第46-48页
·素性识别程序算法	第46-47页
·实验结果及分析	第47-48页
第四章未登录词识别瓶颈——分词不一致问题及解决	第48-57页
·低频双字词的界定模糊	第48页
·《信息处理用现代汉语分词规范》的缺陷	第48-50页
·《信息处理用现代汉语分词规范》与语言学理论的矛盾	第50页
·语料库中的切分不一致及影响	第50-52页
·语料库中的切分错误	第52-53页
·分词规范的修改的建议	第53-55页
·修改词的定义的理据	第55-57页
第五章基于网络的词判别方法	第57-60页
·方法说明	第57-58页
·实验结果及分析	第58-60页
结论及展望	第60-61页
参考文献	第61-67页
致谢	第67页