首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

文本聚类及其在电子病历分析中的应用研究

致谢第5-6页
摘要第6-7页
ABSTRACT第7-8页
1 引言第12-18页
    1.1 研究背景及意义第12-13页
    1.2 国内外研究现状第13-16页
        1.2.1 文本聚类研究现状第13-14页
        1.2.2 电子病历研究现状第14-16页
    1.3 主要研究内容以及论文结构第16-18页
2 文本聚类相关技术介绍第18-33页
    2.1 文本预处理第18页
    2.2 文本表示第18-21页
        2.2.1 向量空间模型第18-19页
        2.2.2 词嵌入模型第19-21页
    2.3 特征降维第21-22页
    2.4 文本相似性计算方法第22-24页
        2.4.1 欧式距离第22-23页
        2.4.2 马氏距离第23页
        2.4.3 余弦相似度第23页
        2.4.4 杰卡德相似性第23-24页
    2.5 传统文本聚类算法介绍第24-27页
        2.5.1 SPK-means聚类算法第24-25页
        2.5.2 LDA聚类算法第25-26页
        2.5.3 NMF聚类算法第26-27页
    2.6 基于频繁词集的文本聚类第27-31页
        2.6.1 频繁词集概念第27-28页
        2.6.2 频繁词集挖掘算法第28-29页
        2.6.3 基于频繁词集的文本聚类算法第29-31页
    2.7 本章小结第31-33页
3 一种新的基于频繁词集表示的文本聚类算法第33-51页
    3.1 引言第33页
    3.2 算法架构第33-34页
    3.3 数据预处理第34-35页
        3.3.1 文本分词第34页
        3.3.2 文本特征选择第34-35页
    3.4 频繁词集挖掘和文本表示模型第35页
    3.5 构建文本网络第35-36页
    3.6 文本网络社区划分第36-39页
        3.6.1 GN算法第37-38页
        3.6.2 Newman快速算法第38-39页
    3.7 FIC算法中的社区划分第39-40页
    3.8 主题描述第40页
    3.9 实验结果与分析第40-50页
        3.9.1 数据集第40-42页
        3.9.2 聚类评价指标第42-43页
        3.9.3 实验结果与分析第43-45页
        3.9.4 实验中的阈值调整第45-46页
        3.9.5 实验中对文本主题的描述第46-50页
    3.10 本章小结第50-51页
4 文本聚类在电子病历组织中的应用研究第51-57页
    4.1 结构化电子病历第51-52页
    4.2 电子病历聚类方法框架第52-54页
        4.2.1 病历实体抽取第52-53页
        4.2.2 电子病历双表示模型第53页
        4.2.3 电子病历相似性计算第53-54页
        4.2.4 电子病历网络构建第54页
        4.2.5 病历网络划分与类簇描述第54页
    4.3 实验结果第54-56页
        4.3.1 实验数据第54页
        4.3.2 实验方案第54-55页
        4.3.3 实验结果第55-56页
    4.4 本章小结第56-57页
5 结论和展望第57-59页
    5.1 研究内容与总结第57-58页
    5.2 展望第58-59页
参考文献第59-63页
作者简历及攻读硕士学位期间取得的研究成果第63-65页
学位论文数据集第65页

论文共65页,点击 下载论文
上一篇:基于马尔科夫随机场和模糊集理论的场景分类算法研究
下一篇:基于双目视觉的原木楞堆径级检测系统研究