基于统计的生物命名实体识别研究

摘要	第1-4页
ABSTRACT	第4-10页
第一章绪论	第10-17页
·论文研究的背景	第10-12页
·统计自然语言处理	第10-11页
·命名实体识别	第11-12页
·研究现状	第12-15页
·生物命名实体研究发展的基本情况	第12页
·JNLPBA	第12-13页
·BiOCreAtlvE	第13-14页
·ABNER	第14-15页
·国内外研究现状	第15页
·论文研究的意义	第15-16页
·论文的组织结构	第16-17页
第二章生物命名实体识别问题	第17-26页
·引言	第17页
·求解问题的方法	第17-23页
·隐马尔可夫模型(Hidden Markov Model，HMM)	第18页
·最大熵马尔可夫模型(Maximum Entropy Markov Model，MEMM)	第18-19页
·条件随机域模型(Conditional Random Field，CRF)	第19-20页
·支持向量机模型(Support Vector Machine，SVM)	第20-21页
·N元语法模型(n-gram)	第21-23页
·问题求解过程中涉及的主要问题	第23-25页
·规则(或特征)的获取	第23页
·生物命名实体边界划分	第23-24页
·统计中的浮点数下溢问题	第24页
·数据稀疏问题	第24-25页
·评测方法	第25-26页
第三章隐马尔可夫模型	第26-43页
·HMM理论基础	第26-29页
·马尔可夫链	第26-27页
·隐马尔可夫模型的定义	第27-28页
·隐马尔可夫模型的三个基本问题	第28-29页
·HMM的模型初始化	第29页
·计算HMM观测序列的概率	第29-31页
·前向过程	第30页
·后向过程	第30-31页
·前后向过程	第31页
·通过HMM确定最佳状态序列	第31-33页
·问题描述	第31-32页
·Viterbi算法	第32-33页
·HMM的参数沽计	第33-34页
·问题描述	第33页
·Baum-Welch算法	第33-34页
·数据平滑技术	第34-42页
·Additive平滑技术	第35-37页
·Good-Turing估计	第37-38页
·Jelinek-Mercer平滑技术	第38-39页
·Witten-Bell平滑技术	第39-40页
·绝对折扣法	第40-41页
·Katz平滑技术	第41页
·Kneser-Ney平滑技术	第41-42页
·隐马尔可夫模型的应用	第42-43页
第四章基于统计的生物命名实体识别的算法	第43-68页
·引言	第43-44页
·环境及预处理	第44-47页
·编程环境	第44页
·预处理工作	第44-45页
·GENIA语料库简介	第45-47页
·训练模型	第47-61页
·基本思想	第47-49页
·定义HMM	第49-51页
·词结构相似度(LSS)	第51-53页
·符号预处理	第53-56页
4 3.5 K集中元素的获取	第56-59页
·A，B，п中的概率统计	第59-61页
·测试	第61-66页
·基本思想	第61-62页
·分词	第62-65页
·用Viterbi算法进行序列标注	第65-66页
·评测	第66-68页
第五章实验及数据	第68-74页
·实验一	第68-70页
·实验二	第70-71页
·实验三	第71-72页
·比较与结论	第72-74页
第六章总结与展望	第74-77页
·总结	第74页
·所做的工作	第74-75页
·下一步的工作	第75-77页
参考文献	第77-81页
致谢	第81-82页
附录	第82-102页
附录A 标注GENIA语料库的36个类别	第82-83页
附录B 词结构相似度计算的代码	第83-90页
附录C 获取K集数据的代码	第90-94页
附录D 获取HMM参数A，B，п的代码	第94-97页
附录E 测试过程中对句子进行分词的代码	第97-101页
附录F 模型进行F评测的代码	第101-102页