首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

面向机器学习方法的命名实体识别

独创性声明第1-5页
摘要第5-6页
Abstract第6-10页
第一章 前言第10-14页
 1.1 命名实体识别的概念第10-11页
 1.2 命名实体识别的应用第11-12页
 1.3 中文命名实体识别的困难和相关工作第12-13页
 1.4 本论文的研究概述和组织第13-14页
第二章 命名实体识别的相关工作第14-24页
 2.1 基于规则的方法第14-15页
 2.2 基于统计的方法第15-16页
 2.3 中文命名实体识别的现状第16-17页
 2.4 中文命名实体识别的评测标准第17-24页
  2.4.1 所有类型通用的规则第17-18页
  2.4.2 适用于所有类型的规则第18页
  2.4.3 适用于组织名的规则第18-19页
  2.4.4 适用于人名的规则第19-20页
  2.4.5 适用于地名的规则第20-21页
  2.4.6 通用的规则第21页
  2.4.7 用于时间的规则第21-22页
  2.4.8 用于日期的规则第22页
  2.4.9 数量的规则第22-24页
第三章 使用有限状态自动机识别时间、日期、数字和抽取译名候选集第24-30页
 3.1 有限状态自动机第24-25页
 3.2 特殊日期和时间的识别第25页
 3.3 识别结果和分析第25-27页
 3.4 译名候选集的抽取第27-30页
第四章 用于命名实体识别的机器学习方法第30-36页
 4.1 最大熵模型第30-33页
  4.1.1 最大熵模型描述第30-32页
  4.1.2 建立最大熵模型第32-33页
 4.2 Boosting第33-36页
第五章 实验第36-50页
 5.1 数据的前处理第36-37页
 5.2 特征类型第37-41页
  5.2.1 基于字的特征(Character Features)第37-38页
  5.2.2 基于词的特征(Word Features)第38-39页
  5.2.3 位置特征(Session Features)第39页
  5.2.4 词性特征(Pos Features)第39-40页
  5.2.5 字典特征(Dictionary Features)第40-41页
 5.3 用于中文命名实体识别的知识第41-43页
  5.3.1 用于人名识别的知识第41-42页
  5.3.2 用于地名识别的资源第42页
  5.3.3 用于组织机构名识别的资源第42-43页
 5.4 特征选择的方法第43页
 5.5 实验细节和实验分析第43-47页
  5.5.1 语料介绍第43-44页
  5.5.2 评测指标第44页
  5.5.3 基本实验第44-45页
  5.5.4 把语言学知识加入到机器学习框架中第45-46页
  5.5.5 分类器比较第46-47页
  5.5.6 用MET-2语料训练和测试第47页
 5.6 实验错误分析第47-50页
第六章 用全局信息进行命名实体识别第50-54页
 6.1 全局信息描述第50-52页
 6.2 在命名实体识别系统中加入全局信息模块第52-54页
第七章 结论和未来工作第54-55页
 7.1 结论第54页
 7.2 未来工作第54-55页
致谢第55-56页
参考文献第56-58页

论文共58页,点击 下载论文
上一篇:生态旅游区识别指标体系
下一篇:民族旅游宣传中的话语和权力问题--基于因特网资料所进行的文本分析