首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--模式识别与装置论文

词典和机器学习相结合的生物命名实体识别

摘要第1-5页
Abstract第5-9页
1 绪论第9-15页
   ·研究背景及意义第9-10页
   ·生物命名实体识别研究的特点及难点第10-11页
   ·研究现状第11-14页
   ·本文的工作第14-15页
2 相关统计模型第15-23页
   ·条件随机域(CRFs)模型第15-19页
     ·无向图结构第15页
     ·势函数表示第15-17页
     ·参数估计第17-18页
     ·概率计算第18-19页
   ·改进的条件随机域模型(Mecab)第19-23页
     ·词图信息第19页
     ·改进的CRFs第19-21页
     ·特征选取第21-23页
3 基于条件随机域(CRFs)的生物命名实体识别第23-32页
   ·生物命名实体的类型与标注方法第23-26页
     ·生物命名实体的定义第23页
     ·生物命名实体的类型第23页
     ·生物命名实体的标注方法第23-26页
   ·基于CRFs的生物命名实体识别特征选取第26-28页
   ·基于CRFs的生物命名实体识别模型构建第28-32页
4 基于词典和机器学习相结合的生物命名实体识别第32-42页
   ·系统流程第32-34页
   ·词典的构建第34-39页
     ·普通词典第34-36页
     ·实体词典第36-39页
   ·分组策略第39-41页
   ·后续处理第41-42页
5 实验结果与分析第42-53页
   ·实验语料第42页
   ·测评参数第42-43页
   ·实验设计与实验结果分析第43-53页
     ·各特征对生物命名实体识别的影响第43-46页
     ·基于CRFs统计机器学习方法的生物命名实体识别第46-47页
     ·不同标记集的识别结果第47-48页
     ·基于词典和机器学习相结合的生物命名实体识别第48-51页
     ·后续处理对识别效果的影响第51页
     ·与相关文献的实验结果的比较第51-52页
     ·实验展望第52-53页
结论第53-55页
参考文献第55-58页
附录A 宾州树库词性标记集第58-60页
附录B 英文停用词表第60-61页
附录C JNLPBA2004训练语料集中高频前后缀词表第61-62页
攻读硕士学位期间发表学术论文情况第62-63页
致谢第63-64页

论文共64页,点击 下载论文
上一篇:信息安全中的光学加密及数字水印技术
下一篇:可比语料中命名实体翻译等价对抽取方法研究