基于电子病历数据的疾病预测模型构建研究
摘要 | 第4-6页 |
Abstract | 第6-8页 |
第1章 绪论 | 第15-28页 |
1.1 研究背景与意义 | 第15-18页 |
1.1.1 研究背景 | 第15-17页 |
1.1.2 研究目的 | 第17-18页 |
1.1.3 研究意义 | 第18页 |
1.2 国内外研究现状 | 第18-23页 |
1.2.1 国外研究现状 | 第18-19页 |
1.2.2 国内研究现状 | 第19-22页 |
1.2.3 国内外研究现状述评 | 第22-23页 |
1.3 研究内容及技术路线 | 第23-28页 |
1.3.1 研究内容 | 第23-24页 |
1.3.2 拟解决的关键问题 | 第24-25页 |
1.3.3 研究方法 | 第25-26页 |
1.3.4 研究思路 | 第26-28页 |
第2章 相关理论、方法与工具 | 第28-44页 |
2.1 数据挖掘相关理论 | 第28-32页 |
2.1.1 信息链 | 第28-29页 |
2.1.2 决策支持 | 第29-31页 |
2.1.3 数据挖掘与知识发现 | 第31-32页 |
2.2 相关方法 | 第32-39页 |
2.2.1 文献调研法 | 第32-33页 |
2.2.2 统计分析法 | 第33-34页 |
2.2.3 数据挖掘方法 | 第34-39页 |
2.3 数据挖掘工具 | 第39-44页 |
2.3.1 Weka | 第39-41页 |
2.3.2 R | 第41-42页 |
2.3.3 SPSS | 第42-44页 |
第3章 疾病预测模型构建策略研究 | 第44-53页 |
3.1 预测模型构建过程关键问题解析 | 第44-48页 |
3.1.1 数据集成与清洗阶段 | 第44-45页 |
3.1.2 数据填补与降维阶段 | 第45-47页 |
3.1.3 模型构建与评价阶段 | 第47-48页 |
3.2 数据集成与清洗方案 | 第48-49页 |
3.3 数据填补与降维方案 | 第49-50页 |
3.3.1 变量选取原则 | 第49页 |
3.3.2 缺失数据处理 | 第49页 |
3.3.3 数据降维 | 第49-50页 |
3.4 模型构建与评价方案 | 第50-51页 |
3.5 疾病预测模型构建策略 | 第51-53页 |
第4章 电子病历数据疾病预测模型构建实证研究 | 第53-79页 |
4.1 数据来源 | 第53-54页 |
4.2 数据清洗与规范化 | 第54-55页 |
4.3 缺失数据填补 | 第55-60页 |
4.3.1 原始数据描述统计 | 第55-56页 |
4.3.2 男女患病差异显著性分析 | 第56-57页 |
4.3.3 男女不同年龄段患病差异显著性分析 | 第57-58页 |
4.3.4 经分层均值填补后数据统计分析 | 第58-60页 |
4.4 数据降维处理 | 第60-68页 |
4.4.1 根据主成分特征根降维 | 第61-64页 |
4.4.2 根据主成分的累计贡献率降维 | 第64-67页 |
4.4.3 根据Logistic回归降维 | 第67-68页 |
4.5 构建糖尿病视网膜病变预测模型 | 第68-75页 |
4.5.1 确定基线精度 | 第68-69页 |
4.5.2 构建预测模型 | 第69-71页 |
4.5.3 模型评价 | 第71-75页 |
4.6 对照实验模型 | 第75-77页 |
4.7 讨论 | 第77-79页 |
4.7.1 数据填补的讨论 | 第77页 |
4.7.2 数据降维的讨论 | 第77-78页 |
4.7.3 不同算法的讨论 | 第78页 |
4.7.4 预测模型构建的讨论 | 第78-79页 |
第5章 结论与展望 | 第79-82页 |
5.1 研究结论 | 第79-80页 |
5.2 研究局限性 | 第80页 |
5.3 展望 | 第80-82页 |
参考文献 | 第82-90页 |
作者简介及科研成果 | 第90-91页 |
致谢 | 第91页 |