首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

面向命名实体抽取的大规模中医临床病历语料库构建方法研究

致谢第5-6页
摘要第6-8页
ABSTRACT第8-9页
1 引言第12-19页
    1.1 研究背景第12-16页
        1.1.1 研究现状第13-14页
        1.1.2 语料库构建的主要方法第14-16页
    1.2 问题提出及研究意义第16-17页
    1.3 本章小结第17-19页
2 命名实体抽取的相关研究第19-30页
    2.1 信息抽取技术的发展历程第19-20页
    2.2 信息抽取系统的研究第20-22页
    2.3 语料库第22-23页
    2.4 临床病历命名实体识别的研究第23-25页
    2.5 命名实体识别的原理及方法第25-29页
        2.5.1 命名实体识别的定义第25页
        2.5.2 CRFs-条件随机场第25-28页
        2.5.3 Bootstrapping第28-29页
    2.6 本章小结第29-30页
3 大规模中医临床病历语料的批量标注方法第30-50页
    3.1 批量标注方法第30-36页
        3.1.1 结构化电子病历标注方法第30-31页
        3.1.2 Bootstrapping/Bubble-Bootstrapping批量标注算法第31-33页
        3.1.3 条件随机场批量标注方法第33-34页
        3.1.4 混合命名实体识别算法第34-36页
    3.2 实验结果及分析第36-48页
        3.2.1 数据集及其预处理第36-39页
        3.2.2 评价方法第39-40页
        3.2.3 样本数据相似性第40-42页
        3.2.4 结构化电子病历标注结果分析第42-43页
        3.2.5 Bootstrapping/Bubble-Bootstrapping标注结果分析第43-44页
        3.2.6 CRFs开放测试和交叉验证结果分析第44-45页
        3.2.7 混合命名实体标注结果分析第45-46页
        3.2.8 编辑距离与标注结果分析第46-48页
    3.3 本章小结第48-50页
4 中医临床病历批量标注系统的设计与实现第50-63页
    4.1 系统概述第50-52页
        4.1.1 系统架构第50-51页
        4.1.2 系统的开发环境第51-52页
    4.2 批量标注系统表结构设计第52-56页
        4.2.1 批量导入模块第52-53页
        4.2.2 数据预处理模块第53页
        4.2.3 命名实体识别算法模块第53-54页
        4.2.4 字典表管理第54-55页
        4.2.5 语料库第55-56页
    4.3 系统功能介绍及展示第56-62页
        4.3.1 登录及系统主界面第56-57页
        4.3.2 数据批量导入管理第57-58页
        4.3.3 数据预处理第58-60页
        4.3.4 批量标注界面第60-61页
        4.3.5 标准语料库管理第61-62页
    4.4 本章小结第62-63页
5 结论与展望第63-65页
    5.1 工作总结第63-64页
    5.2 未来工作第64-65页
参考文献第65-69页
作者简历第69-71页
学位论文数据集第71页

论文共71页,点击 下载论文
上一篇:MSBR脱氮除磷性能研究
下一篇:合作网站数据资源接入系统的设计与实现