首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

基于混合统计模型的汉语命名实体识别方法的研究与实现

摘要第1-8页
ABSTRACT第8-10页
第一章 绪论第10-17页
 1.1 概述第10-11页
 1.2 命名实体识别发展及应用第11-12页
 1.3 命名实体识别难点及存在问题第12-14页
 1.4 命名实体识别评价第14-15页
 1.5 本文的主要工作第15-16页
 1.6 本文的结构第16-17页
第二章 命名实体识别相关工作研究第17-27页
 2.1 命名实体识别方法概述第17-18页
 2.2 基于规则的方法第18-22页
  2.2.1 FACILE第19-20页
  2.2.2 ANNIE第20-22页
 2.3 常用统计语言模型第22-24页
  2.3.1 N元模型第22-23页
  2.3.2 决策树模型第23-24页
 2.4 混合方法第24-26页
  2.4.1 IdentiFinder[29]第24页
  2.4.2 MENE[30]第24-25页
  2.4.3 基于分类的命名实体识别系统[13]第25-26页
 2.5 小结第26-27页
第三章 基于混合统计模型的识别方法第27-40页
 3.1 基本思想第27-28页
 3.2 隐马尔可夫模型第28-31页
  3.2.1 viterbi算法第29-30页
  3.2.2 Baum—Welch算法第30-31页
 3.3 最大熵模型第31-34页
  3.3.1 特征函数第32-33页
  3.3.2 参数训练算法第33-34页
 3.4 语言知识第34-39页
  3.4.1 viterbi框架中的语言知识第35-36页
  3.4.2 最大熵模型中的知识第36-37页
  3.4.3 过滤阶段的知识第37-38页
  3.4.4 数词时间词识别中的知识第38-39页
 3.5 小结第39-40页
第四章 实体词及数词、时间词识别第40-53页
 4.1 实体词识别第40-47页
  4.1.1 正向最大匹配法分词第41-42页
  4.1.2 确定状态搜索空间第42-44页
  4.1.3 最佳路径搜索第44-46页
  4.1.4 实体词合并第46-47页
 4.2 实体词过滤第47-49页
 4.3 数词和时间词识别第49-52页
  4.3.1 基本数词和时间词识别第50-51页
  4.3.2 连续基本数词和时间词合并第51-52页
 4.4 小结第52-53页
第五章 实验数据和分析第53-58页
 5.1 训练语料和测试语料第53-54页
 5.2 实验数据来源第54-55页
 5.3 实验结果第55页
 5.4 实验结果分析第55-57页
 5.5 小结第57-58页
结束语第58-60页
攻读硕士期间发表论文第60-61页
致谢第61-63页
参考文献第63-66页
附录 A: 触发特征词知识列表第66-67页
附录 B: 词性列表第67-69页
附录 C: 识别结果示例第69-70页

论文共70页,点击 下载论文
上一篇:基质金属蛋白酶-2及其组织抑制剂与微血管密度在子宫内膜癌中的表达
下一篇:YBaCuO-X高温超导氧化物和GaN/AIN应变超晶格电子结构的研究