中文电子病历信息抽取关键技术研究

摘要	第4-6页
Abstract	第6-7页
第1章绪论	第10-18页
1.1 课题研究背景及意义	第10-11页
1.1.1 课题研究背景	第10-11页
1.1.2 课题研究意义	第11页
1.2 国内外研究现状	第11-15页
1.2.1 命名实体识别研究现状	第12-13页
1.2.2 实体关系抽取研究现状	第13-14页
1.2.3 中文电子病历信息抽取的难点	第14-15页
1.3 本文的主要内容	第15-16页
1.4 本文组织结构	第16-18页
第2章信息抽取技术理论基础	第18-32页
2.1 命名实体识别方法	第18-20页
2.1.1 基于规则的方法	第18-19页
2.1.2 基于统计的方法	第19-20页
2.1.3 混合方法	第20页
2.2 统计学习模型	第20-29页
2.2.1 马尔科夫模型	第20页
2.2.2 隐马尔科夫模型	第20-24页
2.2.3 最大熵模型	第24-27页
2.2.4 最大熵马尔科夫模型	第27-29页
2.3 信息抽取评估标准	第29-30页
2.4 本章小结	第30-32页
第3章基于条件随机场的病历命名实体识别	第32-48页
3.1 条件随机场模型	第32-36页
3.1.1 图模型	第32-34页
3.1.2 产生式模型与判别式模型	第34-35页
3.1.3 条件随机场原理	第35-36页
3.2 条件随机场建模流程	第36-37页
3.3 实验数据与特征选择	第37-42页
3.3.1 实验数据	第37-38页
3.3.2 特征选择与标注	第38-40页
3.3.3 CRF++特征模板	第40-42页
3.4 实验与结果分析	第42-47页
3.4.1 上下文窗口大小的确定	第42-43页
3.4.2 添加高级特征的实验结果	第43-46页
3.4.3 基于字标注语料与基于词标注语料的对比实验	第46-47页
3.5 本章小结	第47-48页
第4章基于半监督方法的病历命名实体识别	第48-56页
4.1 Bootstrapping算法	第48-49页
4.2 结合最大熵改进的ME-B算法	第49-51页
4.2.1 ME-B算法	第49-51页
4.2.2 ME-B算法的特征选择	第51页
4.3 候选词集过滤机制	第51-52页
4.4 实验与结果分析	第52-55页
4.4.1 ME-B算法的参数对比	第53-54页
4.4.2 ME-B算法与常见的命名实体识别方法的对比	第54-55页
4.5 本章小结	第55-56页
第5章基于卷积树核的病历实体关系抽取	第56-70页
5.1 电子病历中的实体关系	第56-58页
5.2 电子病历实体关系抽取流程	第58-59页
5.3 支持向量机模型	第59-63页
5.3.1 线性可分SVM	第60-61页
5.3.2 线性不可分SVM	第61-62页
5.3.3 非线性SVM	第62-63页
5.3.4 SVM多分类	第63页
5.4 基于卷积树核的实体关系抽取	第63-66页
5.4.1 卷积树核	第63-65页
5.4.2 基于卷积树核的实体关系抽取	第65-66页
5.5 实验与结果分析	第66-68页
5.6 本章小结	第68-70页
结论	第70-72页
参考文献	第72-78页
攻读硕士学位期间所发表的学术成果	第78-80页
致谢	第80页