首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

基于半监督学习的中文电子病历分词和名实体挖掘

摘要第4-5页
Abstract第5-6页
目录第7-9页
第1章 绪论第9-18页
    1.1 课题研究的背景第9-11页
        1.1.1 电子病历概述第9-10页
        1.1.2 医学信息学与电子病历第10-11页
    1.2 课题研究的目的及意义第11-12页
    1.3 国内外研究现状第12-16页
        1.3.1 中文分词第12-14页
        1.3.2 名实体识别第14-16页
    1.4 本文的主要研究内容第16-17页
        1.4.1 基于半监督学习的中文电子病历分词第16-17页
        1.4.2 基于半监督学习的中文电子病历名实体挖掘第17页
    1.5 本文的结构安排第17-18页
第2章 中文电子病历文本特点分析第18-23页
    2.1 结构特点第18-21页
        2.1.1 出院小结的结构特点第18-20页
        2.1.2 病程记录的结构特点第20-21页
    2.2 语言特点第21页
    2.3 实体分布的密集程度第21-22页
    2.4 本章小结第22-23页
第3章 基于半监督学习的中文电子病历分词第23-36页
    3.1 无监督分词第23-31页
        3.1.1 良度概述第23-26页
        3.1.2 边界熵的快速计算第26-28页
        3.1.3 基于边界熵的无监督分词第28-29页
        3.1.4 实验结果与分析第29-31页
    3.2 基于半监督学习的中文电子病历分词第31-35页
        3.2.1 基于 EM 算法的初步切分第31-32页
        3.2.2 基于有序聚类的结果调整第32-34页
        3.2.3 实验结果与分析第34-35页
    3.3 本章小结第35-36页
第4章 基于半监督学习的中文电子病历名实体挖掘第36-48页
    4.1 基于 BOOTSTRAPPING 算法的名实体挖掘第38-44页
        4.1.1 模式的定义第39-41页
        4.1.2 模式的发现第41页
        4.1.3 候选实体的挖掘第41-42页
        4.1.4 模式的评价第42-43页
        4.1.5 候选实体的评价第43页
        4.1.6 Bootstrapping 算法的详细流程第43-44页
    4.2 实验结果与分析第44-47页
    4.3 本章小结第47-48页
结论第48-49页
参考文献第49-54页
攻读硕士学位期间发表的论文第54-56页
致谢第56页

论文共56页,点击 下载论文
上一篇:基于Android平台电子阅读客户端的设计与实现
下一篇:高铁环境下LTE切换技术的研究与应用