首页--工业技术论文--无线电电子学、电信技术论文--通信论文--电声技术和语音信号处理论文--语音信号处理论文--语音识别与设备论文

基于统计的生物命名实体识别研究

摘要第1-4页
ABSTRACT第4-10页
第一章 绪论第10-17页
   ·论文研究的背景第10-12页
     ·统计自然语言处理第10-11页
     ·命名实体识别第11-12页
   ·研究现状第12-15页
     ·生物命名实体研究发展的基本情况第12页
     ·JNLPBA第12-13页
     ·BiOCreAtlvE第13-14页
     ·ABNER第14-15页
     ·国内外研究现状第15页
   ·论文研究的意义第15-16页
   ·论文的组织结构第16-17页
第二章 生物命名实体识别问题第17-26页
   ·引言第17页
   ·求解问题的方法第17-23页
     ·隐马尔可夫模型(Hidden Markov Model,HMM)第18页
     ·最大熵马尔可夫模型(Maximum Entropy Markov Model,MEMM)第18-19页
     ·条件随机域模型(Conditional Random Field,CRF)第19-20页
     ·支持向量机模型(Support Vector Machine,SVM)第20-21页
     ·N元语法模型(n-gram)第21-23页
   ·问题求解过程中涉及的主要问题第23-25页
     ·规则(或特征)的获取第23页
     ·生物命名实体边界划分第23-24页
     ·统计中的浮点数下溢问题第24页
     ·数据稀疏问题第24-25页
   ·评测方法第25-26页
第三章 隐马尔可夫模型第26-43页
   ·HMM理论基础第26-29页
     ·马尔可夫链第26-27页
     ·隐马尔可夫模型的定义第27-28页
     ·隐马尔可夫模型的三个基本问题第28-29页
   ·HMM的模型初始化第29页
   ·计算HMM观测序列的概率第29-31页
     ·前向过程第30页
     ·后向过程第30-31页
     ·前后向过程第31页
   ·通过HMM确定最佳状态序列第31-33页
     ·问题描述第31-32页
     ·Viterbi算法第32-33页
   ·HMM的参数沽计第33-34页
     ·问题描述第33页
     ·Baum-Welch算法第33-34页
   ·数据平滑技术第34-42页
     ·Additive平滑技术第35-37页
     ·Good-Turing估计第37-38页
     ·Jelinek-Mercer平滑技术第38-39页
     ·Witten-Bell平滑技术第39-40页
     ·绝对折扣法第40-41页
     ·Katz平滑技术第41页
     ·Kneser-Ney平滑技术第41-42页
   ·隐马尔可夫模型的应用第42-43页
第四章 基于统计的生物命名实体识别的算法第43-68页
   ·引言第43-44页
   ·环境及预处理第44-47页
     ·编程环境第44页
     ·预处理工作第44-45页
     ·GENIA语料库简介第45-47页
   ·训练模型第47-61页
     ·基本思想第47-49页
     ·定义HMM第49-51页
     ·词结构相似度(LSS)第51-53页
     ·符号预处理第53-56页
  4 3.5 K集中元素的获取第56-59页
     ·A,B,п中的概率统计第59-61页
   ·测试第61-66页
     ·基本思想第61-62页
     ·分词第62-65页
     ·用Viterbi算法进行序列标注第65-66页
   ·评测第66-68页
第五章 实验及数据第68-74页
   ·实验一第68-70页
   ·实验二第70-71页
   ·实验三第71-72页
   ·比较与结论第72-74页
第六章 总结与展望第74-77页
   ·总结第74页
   ·所做的工作第74-75页
   ·下一步的工作第75-77页
参考文献第77-81页
致谢第81-82页
附录第82-102页
 附录A 标注GENIA语料库的36个类别第82-83页
 附录B 词结构相似度计算的代码第83-90页
 附录C 获取K集数据的代码第90-94页
 附录D 获取HMM参数A,B,п的代码第94-97页
 附录E 测试过程中对句子进行分词的代码第97-101页
 附录F 模型进行F评测的代码第101-102页

论文共102页,点击 下载论文
上一篇:仿生机器鱼的控制系统设计与实验研究
下一篇:一种双频双极化天线的研究