首页--语言、文字论文--语言学论文--应用语言学论文

任意类型的未登录词的识别研究

1. 引言第1-9页
 1.1 选题及意义第5页
 1.2 所用资源第5-6页
 1.3 术语界定第6-7页
 1.4 前人相关研究概述第7-9页
  1.4.1 有关汉语未登录词的研究第7页
  1.4.2 关于汉字成词的研究第7-9页
2. 用单字词共现概率处理未登录词第9-19页
 2.1 转移概率的应用第9页
 2.2 从训练语料中得到的资源及其可用性分析第9-12页
  2.2.1 单字词共现表第9-11页
  2.2.2 单字表第11页
  2.2.3 单音词表第11页
  2.2.4 单音量词表第11页
  2.2.5 单音动词表第11-12页
 2.3 算法第12-13页
  2.3.1 算法描述第12页
  2.3.2 关于算法的一点说明第12页
  2.3.3 关于数据阈值的选取第12-13页
 2.4 对分词碎片中的各种情况的分析及处理策略第13-16页
  2.4.1 矛盾信息的解决第13-14页
  2.4.2 单字词的相关数据第14-15页
  2.4.3 检查多字组合而成的可能未登录词的边界第15-16页
  2.4.4 利用构词法知识第16页
 2.5 算法分析示例第16-19页
  2.5.1 专名识别的例子第16-17页
  2.5.2 非专名识别的例子第17-19页
3. 未登录词识别的实验结果和分析第19-27页
 3.1 对校对程序的说明第19页
 3.2 封闭语料测试第19-22页
  3.2.1 全部封闭语料的测试结果第19-20页
  3.2.2 测试封闭语料中不同类的语料结果分析第20页
  3.3.3 封闭测试语料中未登录词辨识的部分结果实例及其分析第20-22页
 3.3 开放语料测试第22-27页
  3.3.1 开放语料测试总的结果第22页
  3.3.2 部分切分后的语料示例第22-23页
  3.3.3 开放语料中对专名的识别情况第23-24页
  3.3.4 开放语料中对非专名的识别情况第24-25页
  3.3.5 只出现过一次的未登录词识别情况第25-27页
4. 结束语第27-28页
参考文献第28-29页
致谢第29页

论文共29页,点击 下载论文
上一篇:北京地名的语言学考察
下一篇:口语教材述评