第一章 绪论 | 第1-19页 |
·知识发现与数据挖掘 | 第8-13页 |
·数据库中的知识发现 | 第8-10页 |
·KDD的功能 | 第10-11页 |
·KDD的应用 | 第11-12页 |
·KDD的研究历史和现状 | 第12-13页 |
·糖尿病概述 | 第13-14页 |
·糖尿病总括 | 第13-14页 |
·Ⅰ型与Ⅱ型糖尿病 | 第14页 |
·利用数据挖掘进行糖尿病发病规律的学习 | 第14-17页 |
·糖尿病研究的意义 | 第15页 |
·传统糖尿病研究的局限性 | 第15-16页 |
·将生物信息学引入糖尿病研究 | 第16-17页 |
·论文工作 | 第17页 |
·论文的组织结构 | 第17-19页 |
第二章 数据挖掘 | 第19-28页 |
·数据挖掘定义 | 第19-20页 |
·技术上的定义 | 第19-20页 |
·商业角度的定义 | 第20页 |
·数据挖掘过程 | 第20-22页 |
·问题定义 | 第20-21页 |
·数据收集和数据预处理 | 第21页 |
·数据挖掘 | 第21-22页 |
·评估与表示 | 第22页 |
·数据挖掘的主要方法和技术 | 第22-24页 |
·数据挖掘研究内容和本质 | 第24-26页 |
·广义知识(Generalization) | 第25页 |
·关联知识(Association) | 第25页 |
·分类知识(Classification&Clustering) | 第25-26页 |
·预测型知识(Prediction) | 第26页 |
·偏差型知识(Deviation) | 第26页 |
·小结 | 第26-28页 |
第三章 数据预处理 | 第28-43页 |
·原始数据 | 第28-34页 |
·健康调查表 | 第28-33页 |
·数据录入 | 第33-34页 |
·数据预处理 | 第34-41页 |
·数据清理 | 第35-36页 |
·数据变换 | 第36-37页 |
·数据归约 | 第37-41页 |
·小结 | 第41-43页 |
第四章 数据挖掘算法及选择 | 第43-57页 |
·主要的数据挖掘算法 | 第43-50页 |
·神经网络 | 第43-47页 |
·决策树 | 第47-48页 |
·关联规则 | 第48-50页 |
·算法的选择及依据 | 第50-53页 |
·分类与聚类 | 第50-52页 |
·算法的选择 | 第52-53页 |
·C4.5算法 | 第53-56页 |
·C4.5算法简介 | 第53-55页 |
·C4.5算法描述 | 第55-56页 |
·小结 | 第56-57页 |
第五章 数据处理及结果分析 | 第57-71页 |
·数据处理 | 第57-63页 |
·类型定义 | 第57-59页 |
·数据结构 | 第59-62页 |
·程序流程 | 第62-63页 |
·运行环境 | 第63页 |
·结果分析 | 第63-70页 |
·分类法的准确性评判 | 第64页 |
·分类结果 | 第64-67页 |
·提高分类法的准确率 | 第67-70页 |
·小结 | 第70-71页 |
第六章 结束语 | 第71-73页 |
·总结 | 第71页 |
·进一步的工作 | 第71-73页 |
参考文献 | 第73-78页 |
硕士期间发表的论文 | 第78-79页 |
致谢 | 第79页 |