基于机器学习的肝硬化疾病预测研究

摘要	第5-6页
Abstract	第6页
第1章绪论	第11-17页
1.1 研究背景及意义	第11-12页
1.2 国内外研究现状	第12-15页
1.3 主要研究内容	第15页
1.4 论文组织结构	第15-17页
第2章关键技术	第17-34页
2.1 Spark分布式大数据处理平台	第17-21页
2.1.1 弹性分布式数据集	第18-20页
2.1.2 Spark SQL	第20页
2.1.3 Spark MLLib	第20-21页
2.1.4 Spark M1与Spark MLlib的区别与联系	第21页
2.2 决策树	第21-23页
2.2.1 划分选择	第22-23页
2.2.2 剪枝处理	第23页
2.3 支持向量机	第23-31页
2.3.1 最大边缘超平面	第24-25页
2.3.2 线性可分支持向量机	第25-28页
2.3.3 线性不可分支持向量机	第28-31页
2.4 分类模型评价指标	第31-33页
2.5 本章小结	第33-34页
第3章肝硬化疾病数据预处理	第34-56页
3.1 数据来源	第34-36页
3.2 数据提取	第36-39页
3.3 数据集成	第39-42页
3.4 数据预处理	第42-55页
3.4.1 数据归一化	第43-50页
3.4.2 缺省值处理	第50-53页
3.4.3 属性值数值化处理	第53-55页
3.5 本章小结	第55-56页
第4章构建分类模型	第56-65页
4.1 实验环境	第56-59页
4.1.1 Scala环境搭建	第57页
4.1.2 Spark环境搭建	第57-59页
4.2 基于Spark平台构建肝硬化分类模型	第59-64页
4.2.1 构造带有类标签特征向量的弹性分布式数据集	第59-60页
4.2.2 肝硬化预测模型	第60-64页
4.3 本章小结	第64-65页
第5章实验分析与原型系统设计实现	第65-70页
5.1 对肝硬化分类模型进行评估	第65-67页
5.2 对比实验结果	第67-68页
5.3 肝硬化预测原型系统设计与实现	第68页
5.4 本章小结	第68-70页
结论	第70-72页
参考文献	第72-75页
附录A 攻读学位期间所参与的主要成果	第75-76页
致谢	第76页