首页--医药、卫生论文--预防医学、卫生学论文--保健组织与事业(卫生事业管理)论文--医疗卫生制度与机构论文--医院、综合医院论文--组织与管理论文

基于Hadoop的中文并行LDA算法及在电子病历挖掘中的应用

摘要第3-5页
ABSTRACT第5-6页
1 绪论第11-17页
    1.1 选题背景与意义第11-13页
    1.2 相关研究现状第13-15页
        1.2.1 LDA算法研究现状第13-14页
        1.2.2 医疗行业数据挖掘现状第14-15页
    1.3 本文的研究工作第15-16页
    1.4 本文结构第16-17页
2 主题模型技术综述第17-28页
    2.1 LDA模型简介第17-18页
    2.2 模型前提第18-19页
        2.2.1 贝叶斯法则第18-19页
        2.2.2 狄利克雷分布第19页
    2.3 建模第19-22页
    2.4 塌缩吉布斯采样算法第22-26页
    2.5 LDA缺点与改进第26-27页
    2.6 本章小结第27-28页
3 基于Hadoop的中文LDA算法设计第28-41页
    3.1 中文文本向量化并行算法第28-31页
        3.1.1 去除符号、停用词第28页
        3.1.2 中文分词工具第28-30页
        3.1.3 中文分词并行算法第30-31页
    3.2 基于Hadoop的并行LDA算法设计第31-35页
        3.2.1 分布式处理系统第31-32页
        3.2.2 数据分块第32-33页
        3.2.3 过滤低频词第33-34页
        3.2.4 算法处理过程第34-35页
    3.3 算法实现第35-39页
    3.4 本章小结第39-41页
4 实验分析第41-49页
    4.1 实验环境及测试数据第41页
    4.2 分析指标第41-42页
    4.3 过程及结果分析第42-47页
    4.4 实验结论与存在的问题第47页
    4.5 本章小结第47-49页
5 并行LDA算法在新生儿疾病挖掘中的应用第49-62页
    5.1 新生儿疾病及诊断特征第49页
    5.2 影响因素分析第49-50页
    5.3 实验设计第50-55页
        5.3.1 数据来源及预处理第50-51页
        5.3.2 参数设置第51-53页
        5.3.3 算法运行结果第53-55页
    5.4 挖掘结果与分析第55-60页
        5.4.1 分类准确率第55-56页
        5.4.2 主题的内容倾向第56-57页
        5.4.3 单因素方差分析第57-60页
    5.5 本章小结第60-62页
6 总结与展望第62-64页
    6.1 总结第62-63页
    6.2 展望第63-64页
参考文献第64-68页
致谢第68-69页
攻读学位期间参加的研究工作和获得的学术成果第69页

论文共69页,点击 下载论文
上一篇:中小企业转型与创新模式及其绩效研究--基于中小板与创业板浙企数据
下一篇:基于遗忘函数和用户的协同过滤推荐算法研究