中文名实体识别与新词发现技术研究

摘要	第1-5页
Abstract	第5-9页
第1章绪论	第9-22页
·本文研究的目的与意义	第9-10页
·中文名实体识别相关研究综述	第10-17页
·名实体识别及其意义	第10-12页
·中文名实体识别的研究现状	第12-14页
·中文名实体识别评测机制及前沿水平	第14-15页
·中文名实体识别主要方法及困难	第15-17页
·新词发现相关研究综述	第17-20页
·新词的定义	第17-18页
·新词发现研究现状	第18-20页
·新词发现的主要方法和困难	第20页
·名实体识别同新词发现的关系	第20-21页
·本文的研究内容及组织	第21-22页
第2章基于层次HMM的名实体识别	第22-36页
·引言	第22-23页
·隐马尔科夫模型	第23-26页
·隐马尔科夫模型描述	第23-24页
·Viterbi算法	第24-26页
·名实体识别的总体框架	第26-27页
·数字字母时间串的识别	第27-28页
·文本粗切分	第28-29页
·模型训练过程	第29-30页
·各层特征及用到的标记集	第30-32页
·人名、简单地名识别中的特征及标记集	第30-31页
·地名简称识别中的特征及标记集	第31-32页
·复杂名实体识别中的特征及标记集	第32页
·数据平滑	第32-34页
·实验结果及分析	第34-35页
·本章小结	第35-36页
第3章基于改进TBL的名实体识别后处理	第36-45页
·引言	第36-37页
·改进的TBL后处理技术	第37-42页
·TBL框架及算法描述	第37-39页
·规则空间的定义	第39页
·目标函数的定义	第39-40页
·规则的优化	第40-42页
·获得的转换规则	第42页
·结果测试及分析	第42-43页
·本章小结	第43-45页
第4章统计与规则结合的新词发现	第45-63页
·引言	第45页
·新词发现总体框架	第45-47页
·识别方法的确定	第47-53页
·统计方法的选择	第47-48页
·统计对象的确定	第48-51页
·规则集构造	第51-53页
·新词集排序	第53-55页
·基于频度比排序	第53-55页
·基于TF/IDF排序	第55页
·基于相似度的领域新词抽取	第55-58页
·实验结果及分析	第58-62页
·规则使用前后性能对比及分析	第59页
·各种排序的性能对比及分析	第59-62页
·本章小结	第62-63页
结论	第63-64页
参考文献	第64-68页
附录	第68-71页
攻读学位期间发表的学术论文	第71-73页
致谢	第73页