摘要 | 第4-5页 |
abstract | 第5页 |
专用术语注释表 | 第8-11页 |
第一章 绪论 | 第11-16页 |
1.1 选题的背景和意义 | 第11-12页 |
1.1.1 选题背景 | 第11页 |
1.1.2 选题意义 | 第11-12页 |
1.2 国内外研究现状 | 第12-14页 |
1.2.1 国外现状 | 第12-13页 |
1.2.2 国内现状 | 第13-14页 |
1.2.3 国内外文献评述 | 第14页 |
1.3 课题的研究内容与组织结构 | 第14-16页 |
1.3.1 研究内容与创新点 | 第14-15页 |
1.3.2 组织结构 | 第15-16页 |
第二章 数据挖掘理论概述 | 第16-25页 |
2.1 数据挖掘起源与概念 | 第16页 |
2.2 数据挖掘技术 | 第16-20页 |
2.2.1 分类与回归 | 第17页 |
2.2.2 聚类分析 | 第17-18页 |
2.2.3 关联分析 | 第18-19页 |
2.2.4 时间序列分析 | 第19-20页 |
2.3 数据挖掘流程 | 第20-23页 |
2.3.1 数据预处理 | 第20-21页 |
2.3.2 挖掘模型建立 | 第21-22页 |
2.3.3 评估模式 | 第22-23页 |
2.3.4 知识表示 | 第23页 |
2.4 本章小结 | 第23-25页 |
第三章 死因登记数据挖掘流程及时间序列建模实例 | 第25-39页 |
3.1 死因登记数据简介 | 第25页 |
3.2 死因登记数据挖掘流程 | 第25-26页 |
3.3 死因登记数据预处理 | 第26-28页 |
3.3.1 数据集成 | 第26-27页 |
3.3.2 数据筛选 | 第27-28页 |
3.4 死因登记数据探索性分析 | 第28-29页 |
3.5 重大疾病死亡情况预测 | 第29-38页 |
3.5.1 癌症死亡人数占比建模 | 第29-36页 |
3.5.2 其他死亡疾病死亡人数占比建模 | 第36-38页 |
3.6 本章小结 | 第38-39页 |
第四章 基于死因登记数据的K-modes聚类算法改进 | 第39-50页 |
4.1 死因登记数据特征变量特性 | 第39-40页 |
4.2 K-modes算法介绍 | 第40页 |
4.2.1 K-modes算法距离度量 | 第40页 |
4.2.2 K-modes算法流程 | 第40页 |
4.3 K-modes算法改进研究 | 第40-42页 |
4.4 针对混合型分类数据的K-modes改进算法 | 第42-45页 |
4.4.1 无序型属性距离度量的改进 | 第42页 |
4.4.2 有序型属性距离度量 | 第42-43页 |
4.4.3 属性权重 | 第43-44页 |
4.4.4 改进算法的算法流程 | 第44-45页 |
4.5 数值实例 | 第45-48页 |
4.5.1 数据集说明 | 第45页 |
4.5.2 聚类正确率比较 | 第45-46页 |
4.5.3 聚类距离比较 | 第46-48页 |
4.6 方法评价与应用 | 第48-49页 |
4.6.1 方法评价 | 第48页 |
4.6.2 方法应用 | 第48-49页 |
4.7 本章小结 | 第49-50页 |
第五章 基于死因登记数据的出生日期启示性研究 | 第50-59页 |
5.1 出生日期启示性研究背景 | 第50-51页 |
5.2 出生日期启示性研究方法 | 第51-52页 |
5.2.1 研究数据说明 | 第51页 |
5.2.2 研究数据处理 | 第51页 |
5.2.3 分类算法选择重要特征 | 第51-52页 |
5.2.4 关联规则挖掘 | 第52页 |
5.3 出生日期启示性研究分析结果 | 第52-56页 |
5.3.1 描述性统计 | 第52页 |
5.3.2 随机森林算法选择重要变量 | 第52-53页 |
5.3.3 重要特征人群内部分析 | 第53-56页 |
5.3.4 关联规则挖掘结果 | 第56页 |
5.4 出生日期启示性研究总结与讨论 | 第56-58页 |
5.5 本章小结 | 第58-59页 |
第六章 总结与展望 | 第59-61页 |
6.1 总结 | 第59页 |
6.2 展望 | 第59-61页 |
参考文献 | 第61-64页 |
附录1 攻读硕士学位期间撰写的论文 | 第64-65页 |
附录2 程序清单 | 第65-66页 |
致谢 | 第66页 |