| 第一章 绪论 | 第1-19页 |
| ·知识发现与数据挖掘 | 第8-13页 |
| ·数据库中的知识发现 | 第8-10页 |
| ·KDD的功能 | 第10-11页 |
| ·KDD的应用 | 第11-12页 |
| ·KDD的研究历史和现状 | 第12-13页 |
| ·糖尿病概述 | 第13-14页 |
| ·糖尿病总括 | 第13-14页 |
| ·Ⅰ型与Ⅱ型糖尿病 | 第14页 |
| ·利用数据挖掘进行糖尿病发病规律的学习 | 第14-17页 |
| ·糖尿病研究的意义 | 第15页 |
| ·传统糖尿病研究的局限性 | 第15-16页 |
| ·将生物信息学引入糖尿病研究 | 第16-17页 |
| ·论文工作 | 第17页 |
| ·论文的组织结构 | 第17-19页 |
| 第二章 数据挖掘 | 第19-28页 |
| ·数据挖掘定义 | 第19-20页 |
| ·技术上的定义 | 第19-20页 |
| ·商业角度的定义 | 第20页 |
| ·数据挖掘过程 | 第20-22页 |
| ·问题定义 | 第20-21页 |
| ·数据收集和数据预处理 | 第21页 |
| ·数据挖掘 | 第21-22页 |
| ·评估与表示 | 第22页 |
| ·数据挖掘的主要方法和技术 | 第22-24页 |
| ·数据挖掘研究内容和本质 | 第24-26页 |
| ·广义知识(Generalization) | 第25页 |
| ·关联知识(Association) | 第25页 |
| ·分类知识(Classification&Clustering) | 第25-26页 |
| ·预测型知识(Prediction) | 第26页 |
| ·偏差型知识(Deviation) | 第26页 |
| ·小结 | 第26-28页 |
| 第三章 数据预处理 | 第28-43页 |
| ·原始数据 | 第28-34页 |
| ·健康调查表 | 第28-33页 |
| ·数据录入 | 第33-34页 |
| ·数据预处理 | 第34-41页 |
| ·数据清理 | 第35-36页 |
| ·数据变换 | 第36-37页 |
| ·数据归约 | 第37-41页 |
| ·小结 | 第41-43页 |
| 第四章 数据挖掘算法及选择 | 第43-57页 |
| ·主要的数据挖掘算法 | 第43-50页 |
| ·神经网络 | 第43-47页 |
| ·决策树 | 第47-48页 |
| ·关联规则 | 第48-50页 |
| ·算法的选择及依据 | 第50-53页 |
| ·分类与聚类 | 第50-52页 |
| ·算法的选择 | 第52-53页 |
| ·C4.5算法 | 第53-56页 |
| ·C4.5算法简介 | 第53-55页 |
| ·C4.5算法描述 | 第55-56页 |
| ·小结 | 第56-57页 |
| 第五章 数据处理及结果分析 | 第57-71页 |
| ·数据处理 | 第57-63页 |
| ·类型定义 | 第57-59页 |
| ·数据结构 | 第59-62页 |
| ·程序流程 | 第62-63页 |
| ·运行环境 | 第63页 |
| ·结果分析 | 第63-70页 |
| ·分类法的准确性评判 | 第64页 |
| ·分类结果 | 第64-67页 |
| ·提高分类法的准确率 | 第67-70页 |
| ·小结 | 第70-71页 |
| 第六章 结束语 | 第71-73页 |
| ·总结 | 第71页 |
| ·进一步的工作 | 第71-73页 |
| 参考文献 | 第73-78页 |
| 硕士期间发表的论文 | 第78-79页 |
| 致谢 | 第79页 |