决策树在数据挖掘中若干问题的研究
第一章 绪论 | 第1-14页 |
1.1 本文的选题背景与研究意义 | 第7-8页 |
1.2 分类数据挖掘的相关基本概念 | 第8-11页 |
1.2.1 数据挖掘定义 | 第8页 |
1.2.2 数据挖掘分类 | 第8-9页 |
1.2.3 分类数据挖掘的主要步骤 | 第9-10页 |
1.2.4 分类数据挖掘面临的主要问题 | 第10-11页 |
1.2.5 下一步的研究方向 | 第11页 |
1.3 本文的主要工作和创新点 | 第11-14页 |
1.3.1 本文主要工作 | 第11-13页 |
1.3.2 本文主要创新点 | 第13-14页 |
第二章 决策树分类方法 | 第14-23页 |
2.1 决策树定义及特点 | 第14页 |
2.2 决策树的信息论原理 | 第14-17页 |
2.2.1 信息熵 | 第15-16页 |
2.2.2 互信息 | 第16-17页 |
2.3 构建决策树的主要步骤 | 第17-19页 |
2.3.1 连续属性离散化 | 第17-18页 |
2.3.2 选择测试属性构造决策树 | 第18-19页 |
2.3.3 决策树剪枝 | 第19页 |
2.4 决策树的研究进展及主要研究方向 | 第19-23页 |
2.4.1 离散化方法研究 | 第19-20页 |
2.4.2 降维方法研究 | 第20-21页 |
2.4.3 属性选择标准研究 | 第21页 |
2.4.4 决策树修剪方法研究 | 第21-22页 |
2.4.5 与神经网络方法相结合的研究 | 第22-23页 |
第三章 神经网络与决策树相结合的分类方法研究 | 第23-32页 |
3.1 引言 | 第23-24页 |
3.2 传统决策树生成和剪枝过程简介 | 第24-25页 |
3.3 RBF神经网络 | 第25页 |
3.4 基于神经网络的特征选择和决策树的建立 | 第25-26页 |
3.5 仿真试验 | 第26-31页 |
3.6 本章小结 | 第31-32页 |
第四章 连续属性离散化研究 | 第32-46页 |
4.1 引言 | 第32-33页 |
4.2 传统离散化算法简介 | 第33-34页 |
4.3 基于熵的离散化评价标准研究 | 第34-40页 |
4.4 BMIC离散化算法 | 第40-42页 |
4.4.1 临界点合并 | 第40-42页 |
4.4.2 少数点区间合并 | 第42页 |
4.4.3 不一致度调整 | 第42页 |
4.5 BMIC离散化算法步骤 | 第42-43页 |
4.6 仿真试验 | 第43-45页 |
4.7 本章小结 | 第45-46页 |
第五章 组合优化决策树方法研究 | 第46-53页 |
5.1 引言 | 第46-47页 |
5.2 决策树处理大规模数据的主要问题 | 第47-48页 |
5.3 基于属性重要性排序的降维方法 | 第48-49页 |
5.4 决策树属性选择标准的改进 | 第49-50页 |
5.5 离散化算法改进 | 第50页 |
5.6 组合优化决策树算法步骤 | 第50-51页 |
5.7 仿真试验 | 第51-52页 |
5.8 本章总结 | 第52-53页 |
第六章 总结与展望 | 第53-55页 |
6.1 全文总结 | 第53-54页 |
6.2 本文研究内容的可能后续工作和研究前景 | 第54-55页 |
参考文献 | 第55-60页 |
发表论文和科研情况说明 | 第60-61页 |
致谢 | 第61页 |