| 摘要 | 第1-6页 |
| Abstract | 第6-7页 |
| 致谢 | 第7-12页 |
| 第一章 绪论 | 第12-20页 |
| ·数据挖掘 | 第12-15页 |
| ·数据挖掘的发展 | 第12-13页 |
| ·数据挖掘的模式 | 第13-14页 |
| ·数据挖掘面临的挑战 | 第14-15页 |
| ·分类简介 | 第15-18页 |
| ·分类研究现状 | 第15页 |
| ·常用的分类模型 | 第15-18页 |
| ·本文的课题来源及主要内容及组织 | 第18-19页 |
| ·小结 | 第19-20页 |
| 第二章 决策树分类算法及其优化方法综述 | 第20-32页 |
| ·基于决策树的经典分类算法 | 第20-26页 |
| ·CLS算法 | 第20-21页 |
| ·ID3算法 | 第21-22页 |
| ·C4.5算法 | 第22-24页 |
| ·CART算法 | 第24-25页 |
| ·SLIQ算法 | 第25-26页 |
| ·决策树优化研究概述 | 第26-31页 |
| ·改进测试属性选择方法 | 第27页 |
| ·修改测试属性空间 | 第27-28页 |
| ·对数据进行限制 | 第28-29页 |
| ·属性离散化 | 第29页 |
| ·剪枝 | 第29-30页 |
| ·改变数据结构 | 第30-31页 |
| ·多方法融合 | 第31页 |
| ·其它优化方法 | 第31页 |
| ·小结 | 第31-32页 |
| 第三章 基于可疑实例影响度分析的决策树优化研究 | 第32-38页 |
| ·可疑实例辨别及其对全局影响度研究概述 | 第32-33页 |
| ·基于可疑实例影响度分析的改进的 C4.5rules算法 | 第33-37页 |
| ·经典的C4.5rules算法 | 第33页 |
| ·基于可疑实例影响度度量的改进的C4.5rules算法 | 第33-36页 |
| ·实验分析 | 第36-37页 |
| ·小结 | 第37-38页 |
| 第四章 基于 PDN变化趋势的决策树优化研究 | 第38-46页 |
| ·过度拟合及剪枝 | 第38-39页 |
| ·基于 PDN变化趋势的预剪枝方法 | 第39-43页 |
| ·算法描述 | 第40-41页 |
| ·关键代码 | 第41-43页 |
| ·实验 | 第43-45页 |
| ·试验效果图 | 第43-45页 |
| ·小结 | 第45-46页 |
| 第五章 实验系统简介 | 第46-53页 |
| ·引言 | 第46页 |
| ·系统结构及实现 | 第46-49页 |
| ·系统主界面 | 第46-47页 |
| ·数据导入模块 | 第47-48页 |
| ·决策树算法模块 | 第48-49页 |
| ·主要函数介绍 | 第49-50页 |
| ·实验数据 | 第50-52页 |
| ·小结 | 第52-53页 |
| 第六章 结束语 | 第53-55页 |
| ·本文总结 | 第53-54页 |
| ·工作展望 | 第54-55页 |
| 参考文献 | 第55-58页 |
| 研究生期间主要科研工作及成果 | 第58页 |