首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于CRF的中文人名自动识别研究

摘要第1-8页
Abstract第8-10页
目录第10-12页
第1章 绪论第12-18页
   ·研究背景和意义第12-13页
   ·国内外研究现状第13-14页
   ·中文人名识别的困难第14-15页
   ·本文的主要工作第15-17页
   ·本文结构第17-18页
第2章 人名识别相关研究第18-29页
   ·人名识别方法概述第18-20页
     ·基于规则的方法第18-19页
     ·基于统计的方法第19-20页
     ·统计与规则相结合的方法第20页
   ·隐马尔可夫模型第20-22页
   ·最大熵模型第22-23页
   ·CRF模型第23-27页
     ·CRF的定义第24-25页
     ·势函数第25-26页
     ·CRF模型的参数估计第26-27页
     ·CRF的矩阵描述和计算第27页
   ·本章小结第27-29页
第3章 CRRM方法的预处理第29-38页
   ·训练语料库转换第29-31页
     ·标注粒度第29页
     ·标注集第29-31页
   ·特征和特征模板第31-36页
     ·特征函数的表示第31-32页
     ·特征集第32-34页
     ·特征模板第34页
     ·特征阈值选择第34-36页
   ·基于转换的错误驱动学习方法的规则提取第36-37页
   ·本章小结第37-38页
第4章 CRRM方法的中文人名识别第38-51页
   ·CRRM方法的识别流程第38-39页
   ·CRF模型的训练和测试第39页
   ·CRF识别结果的预处理第39-41页
     ·CRF识别结果的格式转换第39-40页
     ·CRF识别结果的词语切分第40-41页
   ·中文人名的可信度模型第41-46页
     ·中文人名特点第41-43页
     ·中文人名的可信度模型第43-46页
   ·规则修正第46-47页
   ·局部统计模型第47-49页
   ·扩散操作第49-50页
   ·本章小结第50-51页
第5章 实验结果及分析第51-59页
   ·实验语料库第51-52页
   ·评测指标第52页
   ·实验结果及分析第52-56页
     ·边缘概率阈值的确定第53页
     ·Core CRF和CRRM方法的实验效果比较第53-54页
     ·开放测试和封闭测试的效果比较第54-55页
     ·与其他方法的比较第55-56页
   ·实验结果分析第56-59页
     ·正确识别举例与分析第56页
     ·错误识别举例与分析第56-57页
     ·错误识别产生的原因总结第57-59页
第6章 总结与展望第59-61页
   ·本文工作总结第59-60页
   ·进一步展望第60-61页
附录一 作者攻读硕士学位期间发表的学术论文第61-62页
附录二 作者攻读硕士学位期间参与的科研项目及申请专利第62-63页
参考文献第63-67页
后记第67页

论文共67页,点击 下载论文
上一篇:面向海量数据的索引技术研究
下一篇:中文Deep Web数据集成系统的研究与应用