基于不完备医疗数据的疾病风险预测研究
摘要 | 第4-5页 |
ABSTRACT | 第5页 |
第1章 绪论 | 第8-13页 |
1.1 研究背景及意义 | 第8页 |
1.2 医疗数据分析研究现状 | 第8-11页 |
1.2.1 信息抽取 | 第9页 |
1.2.2 表征学习 | 第9-10页 |
1.2.3 预测模型 | 第10-11页 |
1.3 关键问题 | 第11-12页 |
1.4 本文结构安排 | 第12-13页 |
第2章 数据填充策略 | 第13-18页 |
2.1 引言 | 第13页 |
2.2 缺失值填充策略介绍 | 第13-17页 |
2.2.1 非负矩阵分解(NMF) | 第13-14页 |
2.2.2 中位数(Median) | 第14-15页 |
2.2.3 限制玻尔兹曼机(RBM) | 第15-16页 |
2.2.4 奇异值分解(SVD) | 第16-17页 |
2.3 本章小结 | 第17-18页 |
第3章 分类预测模型 | 第18-23页 |
3.1 引言 | 第18页 |
3.2 机器学习算法 | 第18-21页 |
3.2.1 随机森林(RF) | 第18-19页 |
3.2.2 支持向量机(SVM) | 第19页 |
3.2.3 深度神经网络(DNN) | 第19-20页 |
3.2.4 自编码器(AE) | 第20-21页 |
3.3 可解释性增强策略 | 第21-22页 |
3.3.1 最大激活策略 | 第21页 |
3.3.2 约束 | 第21页 |
3.3.3 定性聚类 | 第21-22页 |
3.3.4 模拟学习 | 第22页 |
3.4 本章小结 | 第22-23页 |
第4章 两阶段模拟学习算法 | 第23-30页 |
4.1 引言 | 第23页 |
4.2 谱正则化 | 第23-26页 |
4.3 深度森林 | 第26-28页 |
4.4 基于缺失值填充和深度森林的风险预测 | 第28-29页 |
4.5 本章小结 | 第29-30页 |
第5章 实验结果与分析 | 第30-39页 |
5.1 引言 | 第30页 |
5.2 数据集 | 第30-32页 |
5.2.1 甲状腺癌数据 | 第30-31页 |
5.2.2 肌萎缩侧索硬化数据 | 第31-32页 |
5.3 数据预处理 | 第32-35页 |
5.3.1 数据标准化处理 | 第33页 |
5.3.2 特征重要性分析 | 第33-35页 |
5.4 对比实验 | 第35-38页 |
5.4.1 缺失填充策略比较 | 第35-36页 |
5.4.2 缺失数据填充对预测模型影响 | 第36页 |
5.4.3 分类方法比较 | 第36-38页 |
5.5 本章小结 | 第38-39页 |
第6章 总结与展望 | 第39-40页 |
6.1 工作总结 | 第39页 |
6.2 工作展望 | 第39-40页 |
参考文献 | 第40-44页 |
致谢 | 第44-45页 |
在学期间公开发表论文情况 | 第45页 |