首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文新词识别研究

摘要第1-5页
Abstract第5-9页
1 绪论第9-16页
   ·研究背景与意义第9-10页
   ·新词的定义与特征第10-12页
     ·新词的定义第10-11页
     ·新词的特征第11-12页
   ·新词识别的现状第12-14页
     ·基于规则的方法第12-13页
     ·基于统计的方法第13页
     ·统计与规则相结合的方法第13-14页
   ·新词识别的难点第14页
   ·主要工作与本文组织第14-16页
2 相关理论及新词模式分析第16-30页
   ·自然语言处理概述第16-18页
     ·自然语言处理的研究与发展第16-17页
     ·自然语言处理研究的内容与难点第17-18页
   ·统计语言模型概述第18-20页
   ·中文分词概述第20-21页
     ·中文分词中的基本问题第20-21页
     ·中文分词的基本方法第21页
   ·熵与互信息第21-24页
   ·新词的类型与模式分析第24-29页
     ·单字串模式新词第26-27页
     ·后缀串模式新词第27-28页
     ·其他模式新词第28-29页
   ·本章小结第29-30页
3 基于规则的新词抽取第30-38页
   ·语料的预处理与分词标注第30-31页
     ·网页预处理第30页
     ·语料的分词和词性标注第30-31页
   ·重复串及相关信息的收集第31-36页
     ·重复串的收集第31-32页
     ·重复串上下文信息的收集第32-33页
     ·重复串及相关信息收集算法描述第33-36页
   ·规则过滤第36-37页
     ·基于频率的过滤规则第36页
     ·基于停用词表的过滤规则第36页
     ·基于词性的过滤规则第36-37页
   ·本章小结第37-38页
4 基于统计模型的新词识别第38-48页
   ·内部词概率第38-40页
   ·后缀串模式的识别第40-42页
   ·基于平均互信息的新词识别第42-43页
   ·基于左右信息嫡的新词识别第43-45页
   ·新词识别的流程第45-47页
   ·本章小结第47-48页
5 实验结果与分析第48-55页
   ·实验数据说明第48页
   ·实验评价指标第48-49页
   ·新词识别结果分析第49-52页
     ·平均互信息的新词识别第49-50页
     ·左右信息嫡的新词识别第50-51页
     ·平均互信息与左右信息嫡相结合的新词识别第51-52页
   ·错误分析第52-54页
   ·与前人工作的比较第54页
   ·本章小结第54-55页
结论第55-56页
参考文献第56-59页
攻读硕士学位期间发表学术论文情况第59-60页
致谢第60-61页

论文共61页,点击 下载论文
上一篇:可比较语料库的研究与构建
下一篇:几种基于混沌系统的图像加密算法研究