首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

中文名实体识别与新词发现技术研究

摘要第1-5页
Abstract第5-9页
第1章 绪论第9-22页
   ·本文研究的目的与意义第9-10页
   ·中文名实体识别相关研究综述第10-17页
     ·名实体识别及其意义第10-12页
     ·中文名实体识别的研究现状第12-14页
     ·中文名实体识别评测机制及前沿水平第14-15页
     ·中文名实体识别主要方法及困难第15-17页
   ·新词发现相关研究综述第17-20页
     ·新词的定义第17-18页
     ·新词发现研究现状第18-20页
     ·新词发现的主要方法和困难第20页
   ·名实体识别同新词发现的关系第20-21页
   ·本文的研究内容及组织第21-22页
第2章 基于层次HMM的名实体识别第22-36页
   ·引言第22-23页
   ·隐马尔科夫模型第23-26页
     ·隐马尔科夫模型描述第23-24页
     ·Viterbi算法第24-26页
   ·名实体识别的总体框架第26-27页
   ·数字字母时间串的识别第27-28页
   ·文本粗切分第28-29页
   ·模型训练过程第29-30页
   ·各层特征及用到的标记集第30-32页
     ·人名、简单地名识别中的特征及标记集第30-31页
     ·地名简称识别中的特征及标记集第31-32页
     ·复杂名实体识别中的特征及标记集第32页
   ·数据平滑第32-34页
   ·实验结果及分析第34-35页
   ·本章小结第35-36页
第3章 基于改进TBL的名实体识别后处理第36-45页
   ·引言第36-37页
   ·改进的TBL后处理技术第37-42页
     ·TBL框架及算法描述第37-39页
     ·规则空间的定义第39页
     ·目标函数的定义第39-40页
     ·规则的优化第40-42页
     ·获得的转换规则第42页
   ·结果测试及分析第42-43页
   ·本章小结第43-45页
第4章 统计与规则结合的新词发现第45-63页
   ·引言第45页
   ·新词发现总体框架第45-47页
   ·识别方法的确定第47-53页
     ·统计方法的选择第47-48页
     ·统计对象的确定第48-51页
     ·规则集构造第51-53页
   ·新词集排序第53-55页
     ·基于频度比排序第53-55页
     ·基于TF/IDF排序第55页
   ·基于相似度的领域新词抽取第55-58页
   ·实验结果及分析第58-62页
     ·规则使用前后性能对比及分析第59页
     ·各种排序的性能对比及分析第59-62页
   ·本章小结第62-63页
结论第63-64页
参考文献第64-68页
附录第68-71页
攻读学位期间发表的学术论文第71-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:基于可安装文件系统的过滤加密技术的研究与应用
下一篇:非稳定度度量原理及其在颈动脉超声图像中的应用