首页--医药、卫生论文--一般理论论文--医学与其他学科的关系论文

基于Gradient Boosting算法的海量健康数据挖掘研究与应用

摘要第4-5页
ABSTRACT第5-6页
第一章 绪论第9-17页
    1.1 研究背景与意义第9-10页
    1.2 健康数据挖掘概述第10-14页
        1.2.1 数据挖掘技术与工具简介第10-13页
        1.2.2 健康数据挖掘简介第13-14页
        1.2.3 健康数据挖掘研究现状第14页
    1.3 论文研究的内容及创新点第14-16页
    1.4 论文的组织结构第16-17页
第二章 健康数据挖掘理论和方案设计第17-31页
    2.1 健康数据的预处理第17-20页
        2.1.1 健康数据的特征选择第17-19页
        2.1.2 健康数据的样本均衡第19-20页
    2.2 Gradient Boosting算法研究第20-25页
        2.2.1 集成学习算法第20-22页
        2.2.2 集成模型的误差分解第22页
        2.2.3 Boosting算法第22-23页
        2.2.4 Gradient Boosting算法第23-25页
    2.3 模型验证与评估第25-29页
        2.3.1 交叉验证第25-26页
        2.3.2 网格搜索第26-27页
        2.3.3 模型评估标准第27-29页
    2.4 本章小结第29-31页
第三章 体检数据肝部肿瘤筛查实验第31-45页
    3.0 肿瘤筛查的意义和步骤第31-32页
    3.1 数据准备第32-35页
        3.1.1 编码格式转换第32-33页
        3.1.2 导入MongoDB数据库第33-34页
        3.1.3 导出数据全集第34-35页
    3.2 数据预处理第35-37页
        3.2.1 数据标注第35-36页
        3.2.2 设计“独热编码”特征第36页
        3.2.3 补充缺失值第36页
        3.2.4 基于SMOTE算法的正样本过采样第36-37页
    3.3 特征选择第37-38页
    3.4 模型训练第38-39页
    3.5 对比实验与结果评估第39-43页
        3.5.1 模型评估指标第39-40页
        3.5.2 模型ROC曲线第40-42页
        3.5.3 特征重要度第42-43页
    3.6 模型效果反馈与系统设计第43-44页
    3.7 本章小结第44-45页
第四章 海量体检数据癌症风险筛查系统的设计与实现第45-55页
    4.1 癌症风险筛查的意义和方案设计第45-47页
        4.1.1 癌症风险筛查的意义第45-46页
        4.1.2 癌症风险筛查方案设计第46-47页
    4.2 XGBoost平台研究与部署第47-50页
        4.2.1 XGBoost简介第47-48页
        4.2.2 XGBoost算法理论第48-50页
        4.2.3 XGBoost环境部署第50页
    4.3 海量健康数据准备和预处理第50-51页
    4.4 癌症风险筛查模型参数设置和模型训练第51页
    4.5 对比结果与模型评估第51-53页
    4.6 本章小结第53-55页
第五章 总结与展望第55-57页
    5.1 本文工作总结第55页
    5.2 存在的问题及下一步研究计划第55-57页
参考文献第57-61页
致谢第61页

论文共61页,点击 下载论文
上一篇:我国互联网医疗发展现状分析及对策研究
下一篇:疾病防治与地方文化变迁--以余江血防为中心的考察