基于决策树的数据分类算法研究与实现
摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
第一章 绪论 | 第9-13页 |
1.1 课题研究的背景和意义 | 第9-10页 |
1.2 论文内容和创新点 | 第10-11页 |
1.3 研究生期间主要工作 | 第11-12页 |
1.4 论文结构 | 第12-13页 |
第二章 数据挖掘与云计算技术研究现状 | 第13-23页 |
2.1 数据挖掘技术研究现状 | 第13-19页 |
2.1.1 数据挖掘技术概述 | 第13-15页 |
2.1.2 数据挖掘关键技术 | 第15-16页 |
2.1.3 数据分类技术 | 第16-18页 |
2.1.4 数据挖掘技术应用 | 第18-19页 |
2.2 云计算技术研究现状 | 第19-23页 |
2.2.1 云计算技术概述 | 第19-20页 |
2.2.2 云计算技术研究成果 | 第20-23页 |
第三章 SPRINT算法的改进 | 第23-31页 |
3.1 SPRINT算法研究 | 第23-25页 |
3.1.1 SPRINT算法基本思想 | 第23-24页 |
3.1.2 传统SPRINT算法寻找最佳分割点 | 第24-25页 |
3.2 SPRINT算法改进 | 第25-31页 |
3.2.1 针对离散属性的改进 | 第25-27页 |
3.2.2 针对连续属性的改进 | 第27-29页 |
3.2.3 仿真实验及结论 | 第29-31页 |
第四章 基于Hadoop平台的数据分类实现 | 第31-44页 |
4.1 基于HADOOP的数据分类模型设计 | 第31-35页 |
4.1.1 分类模型需求分析 | 第31页 |
4.1.2 分类模型基本构成 | 第31-33页 |
4.1.3 分类模型层次结构 | 第33-35页 |
4.2 SPRINT算法的并行策略 | 第35-40页 |
4.2.1 算法的并行化设计 | 第35-37页 |
4.2.2 算法并行化的具体阐述 | 第37-40页 |
4.3 仿真实验及结论 | 第40-44页 |
第五章 总结和展望 | 第44-45页 |
参考文献 | 第45-48页 |
致谢 | 第48-49页 |
攻读学位期间发表的学术论文目录 | 第49页 |