首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于统计与规则相结合的命名实体识别研究

摘要第1-5页
Abstract第5-6页
目录第6-9页
第一章 绪论第9-14页
   ·命名实体研究的背景及意义第9-11页
     ·提高了语料库中分词处理的质量第9-10页
     ·对自然语言进行处理应用的基础第10-11页
   ·中文命名实体识别的国内外现状第11-12页
   ·论文的主要内容以及结构安排第12-14页
第二章 命名实体识别的概述第14-22页
   ·命名实体识别的特点以及难点第14-16页
     ·命名实体识别的特点第14页
     ·命名实体识别的难点第14-16页
   ·中文命名实体的识别方法第16-18页
     ·基于规则的方法第16-17页
     ·基于统计的方法第17-18页
     ·基于统计和规则相结合的方法第18页
   ·中文人名识别的特点以及难点第18-19页
   ·中文人名用字分类第19-21页
   ·本章小结第21-22页
第三章 人名识别知识库及前期准备第22-35页
   ·人名样本库第22-24页
     ·单名用字表第22-23页
     ·双名用字表第23-24页
     ·名字用字分析第24页
   ·姓氏库第24-26页
     ·姓氏表第24-25页
     ·姓氏用字的分析第25-26页
     ·双字人名词词表第26页
   ·人名语料第26-34页
     ·姓氏概率表第27-29页
     ·互信息的介绍第29-32页
       ·互信息的引入第29-30页
       ·人名内部互信息第30-31页
       ·评价函数与过滤阈值确定第31页
       ·交叉潜在姓名的处理第31-32页
     ·中文姓名的识别规则第32-34页
   ·本章小结第34-35页
第四章 基于统计与规则的中文人名识别第35-43页
   ·中文人名识别算法描述第35页
   ·正逆向最大匹配算法第35-38页
     ·正向最大匹配切分算法第35-36页
     ·逆向最大匹配切分算法第36-38页
   ·改进后的逆向最大匹配法第38-41页
     ·Hash 表与 Hash 函数第39页
     ·哈希词典其基本原理第39-40页
     ·待分词字串的预处理第40-41页
   ·基于统计与规则识别的主要过程第41-42页
   ·本章小结第42-43页
第五章 实验结果及分析第43-49页
   ·评测指标及评测集的选取第43-45页
     ·评测指标第43-44页
     ·评测集的选取第44-45页
   ·试验结果以及分析比较第45-47页
   ·部分实例及分析第47-48页
   ·本章小结第48-49页
总结与展望第49-51页
参考文献第51-56页
致谢第56-57页
攻读硕士学位期间发表论文及研究成果第57页

论文共57页,点击 下载论文
上一篇:基于介电谱技术的地沟油检测研究
下一篇:完善我国住房金融制度问题研究