首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

汉语自动分词和中文人名识别技术研究

摘要第1-6页
ABSTRACT第6-8页
第一章 绪论第8-13页
 1.1 自然语言理解技术简介第8-10页
 1.2 汉语自动分词及中文人名识别技术简介第10-11页
 1.3 本文的主要工作及其组织第11-13页
第二章 汉语自动分词第13-23页
 2.1 汉语自动分词的重要性第13页
 2.2 汉语自动分词的难点第13-14页
 2.3 分词系统性能评价第14-15页
 2.4 汉语分词的方法第15-23页
  2.4.1 基于规则的方法第15-18页
  2.4.2 基于统计的方法第18-19页
  2.4.3 无词典自动分词方法第19-21页
  2.4.4 人工智能的分词方法第21-23页
第三章 中文人名识别第23-28页
 3.1 中文人名识别的难点第24页
 3.2 人名识别的方法第24-28页
  3.2.1 基于规则的方法第25页
  3.2.2 基于统计的方法第25-28页
第四章 词性标注和隐马尔可夫模型第28-35页
 4.1 词性标注第28-29页
 4.2 隐马尔可夫模型第29-31页
  4.2.1 HMM模型的一般形式第29-30页
  4.2.2 HMM模型的三个基本问题第30-31页
 4.3 基于HMM的标注模型第31-35页
  4.3.1 概率模型第31-33页
  4.3.2 Viterbi算法第33-35页
第五章 基于HMM的中文分词和人名识别系统第35-57页
 5.1 训练语料库及再加工第35-38页
 5.2 中文自动分词问题归约第38-40页
 5.3 词典机制第40-44页
 5.4 基于N-BEST策略的字段粗切分模型第44-47页
  5.4.1 字段有向图第44-45页
  5.4.2 最大概率分词模型第45-46页
  5.4.3 基于N-best策略的最大概率分词第46-47页
 5.5 基于HMM模型的粗切分评价模型第47-53页
  5.5.1 HMM的评价模型第48-51页
  5.5.2 基于HMM的评价模型示例第51-53页
 5.6 基于词性标注的中文人名识别第53-54页
 5.7 实验结果与分析第54-57页
  5.7.1 实验语料第54页
  5.7.2 评测指标第54-55页
  5.7.3 实验结果第55-56页
  5.7.4 分析第56-57页
第六章 结束语第57-58页
参考文献第58-61页
附录1:《人民日报》标注语料库示例第61-62页
附录2:攻读学位期间发表的学术论文第62-63页
致谢第63页

论文共63页,点击 下载论文
上一篇:大连老虎滩海洋公园有限公司员工绩效管理研究
下一篇:血清抵抗素与冠状动脉病变的相关性研究