摘要 | 第3-5页 |
ABSTRACT | 第5-7页 |
第一章 绪论 | 第11-19页 |
1.1 研究背景 | 第11-12页 |
1.2 相关研究现状 | 第12-16页 |
1.3 研究目标和研究内容 | 第16页 |
1.4 论文结构安排 | 第16-19页 |
第二章 数据挖掘与多疾病共同危险因素挖掘 | 第19-29页 |
2.1 数据挖掘概述 | 第19-22页 |
2.1.1 数据挖掘的概念 | 第19页 |
2.1.2 数据挖掘的步骤 | 第19-20页 |
2.1.3 数据挖掘中的分类技术 | 第20-22页 |
2.1.4 数据挖掘的应用领域 | 第22页 |
2.2 数据挖掘方法 | 第22-25页 |
2.2.1 逻辑回归 | 第22-23页 |
2.2.2 C4.5 | 第23-24页 |
2.2.3 分类回归树 | 第24页 |
2.2.4 卡方自动交互检测 | 第24-25页 |
2.2.5 判别分析 | 第25页 |
2.3 对高血压高血脂疾病共同危险因素的挖掘 | 第25-27页 |
2.4 本章小结 | 第27-29页 |
第三章 分类器集成概述 | 第29-45页 |
3.1 分类器集成的概念及优势 | 第29-31页 |
3.2 分类器集成面临的问题 | 第31-37页 |
3.2.1 基分类器的构造 | 第31-33页 |
3.2.2 基分类器多样性的度量 | 第33-36页 |
3.2.3 基分类器的集成方法 | 第36-37页 |
3.3 集成分类器性能评估 | 第37-39页 |
3.4 常见分类器集成方法 | 第39-44页 |
3.4.1 bagging算法描述 | 第39-41页 |
3.4.2 boosting算法描述 | 第41-43页 |
3.4.3 boosting与bagging的异同 | 第43-44页 |
3.5 本章小结 | 第44-45页 |
第四章 集成分类器在标准数据集上的分类预测实验 | 第45-55页 |
4.1 实验平台描述 | 第45-47页 |
4.1.1 Weka简介 | 第45页 |
4.1.2 实验环境搭建 | 第45-47页 |
4.2 UCI标准数据集 | 第47-49页 |
4.3 构造集成分类器 | 第49-50页 |
4.4 实验组织及步骤 | 第50-52页 |
4.5 实验结果及分析 | 第52-53页 |
4.6 本章小结 | 第53-55页 |
第五章 集成分类器用于高血压高血脂疾病预测 | 第55-67页 |
5.1 高血压高血脂数据集 | 第55-57页 |
5.2 Weka中分类器评价指标 | 第57-61页 |
5.2.1 Kappa统计 | 第57-58页 |
5.2.2 误差预测评价指标 | 第58-59页 |
5.2.3 ROC曲线及AUC | 第59-61页 |
5.3 对高血压高血脂疾病的分类预测 | 第61-65页 |
5.3.1 使用单个分类器对疾病进行预测 | 第61-62页 |
5.3.2 使用集成分类器对疾病进行预测 | 第62页 |
5.3.3 单分类器与集成分类器对疾病预测结果比较与分析 | 第62-65页 |
5.3.4 各个分类器的AUC比较 | 第65页 |
5.4 本章小结 | 第65-67页 |
第六章 总结与展望 | 第67-69页 |
参考文献 | 第69-73页 |
致谢 | 第73-75页 |
攻读学位期间发表的学术论文目录 | 第75页 |