首页--医药、卫生论文--一般理论论文--医学与其他学科的关系论文

临床文本数据信息挖掘去识别技术研究

摘要第7-8页
ABSTRACT第8页
1 绪论第10-21页
    1.1 研究背景和意义第10-11页
        1.1.1 研究背景第10-11页
        1.1.2 研究意义第11页
    1.2 国内外研究现状第11-17页
        1.2.1 国内外临床文本敏感信息界定第11-12页
        1.2.2 国内外命名实体识别研究现状第12-14页
        1.2.3 国内外临床文本命名实体识别研究现状第14-15页
        1.2.4 国内外临床文本去识别研究进展第15-17页
        1.2.5 文献小结第17页
    1.3 研究目标和内容第17-19页
    1.4 研究技术路线第19-20页
    1.5 论文结构安排第20-21页
2 相关概念与技术基础第21-25页
    2.1 相关概念界定第21-22页
        2.1.1 临床文本概念界定第21-22页
        2.1.2 临床文本去识别概念界定第22页
    2.2 相关技术与工具介绍第22-25页
        2.2.3 CRF模型及工具第22-24页
        2.2.4 中文分词技术及工具第24-25页
3 研究方法与数据来源第25-28页
    3.1 研究方法第25-27页
    3.2 数据来源第27-28页
4 数据的标注与统计性描述第28-34页
    4.2 数据的标注第28-29页
        4.2.1 标注指南第28-29页
        4.2.2 标注过程第29页
    4.3 数据的统计性描述第29-34页
        4.3.1 不同级别医疗机构样本中PHI的分布密度第29-31页
        4.3.2 整体语料中PHI的分布密度和表达形式第31-34页
5 临床文本去识别模型详细设计第34-40页
    5.1 临床文本的预处理第34-35页
    5.2 特征集构建第35-36页
    5.3 CRF模型训练与测试第36-38页
    5.4 后处理规则第38-39页
    5.5 评估第39-40页
6 临床文本去识别模型测试第40-46页
    6.1 外部词典对分词工具以及去识别模型的影响第40-42页
    6.2 特征集以及后处理规则对去识别模型的影响第42-43页
    6.3 错误分析第43-46页
        6.3.1 类型错误第44页
        6.3.2 边界错误第44页
        6.3.3 假阴性错误第44-45页
        6.3.4 假阳性错误第45-46页
7 讨论与展望第46-50页
    7.1 讨论第46-48页
        7.1.1 中文临床文本中PHI的分布第46页
        7.1.2 中文临床文本书写的规范性第46-47页
        7.1.3 去识别模型在中文临床文本中的有效性第47-48页
        7.1.4 临床文本的完整性和可用性第48页
    7.2 本研究的局限第48页
    7.3 未来研究的展望第48-50页
致谢第50-51页
参考文献第51-58页
临床文本去识别国内外研究综述第58-70页
    1 资料与方法第58-59页
    2 国内外研究现状第59-64页
    3 结论第64-65页
    参考文献第65-70页
附件1攻读学位期间发表论文目录第70页

论文共70页,点击 下载论文
上一篇:三圈理论视阈下县域基本医疗卫生服务均等化研究--以甘肃省清水县为例
下一篇:原花青素在t-BHP致HEI-OC1细胞氧化损伤中的作用及机制研究