摘要 | 第5-6页 |
ABSTRACT | 第6页 |
第一章 绪论 | 第10-15页 |
1.1 课题背景及研究意义 | 第10-11页 |
1.2 研究现状 | 第11-14页 |
1.2.1 数据挖掘的研究现状 | 第11-13页 |
1.2.2 数据挖掘中决策树算法并行化研究现状 | 第13-14页 |
1.3 本文主要工作及论文结构 | 第14-15页 |
第二章 云计算和数据挖掘技术概述 | 第15-27页 |
2.1 数据挖掘技术概述 | 第15-17页 |
2.1.1 数据挖掘技术及知识发现特征分析 | 第15页 |
2.1.2 数据挖掘模式 | 第15-16页 |
2.1.3 数据挖常用算法 | 第16-17页 |
2.2 云的概念 | 第17-26页 |
2.2.1 云相关的网络技术 | 第19-20页 |
2.2.2 云的平台 | 第20-26页 |
2.3 本章小结 | 第26-27页 |
第三章 决策树算法应用和改进 | 第27-56页 |
3.1 决策树基本知识 | 第27-28页 |
3.2 决策树典型分类算法介绍 | 第28-33页 |
3.2.1 信息论相关概念 | 第29-30页 |
3.2.2 ID3算法 | 第30-31页 |
3.2.3 C4.5 算法 | 第31-33页 |
3.2.4 SLIQ算法 | 第33页 |
3.2.5 CART算法 | 第33页 |
3.3 典型分类决策树算法比较 | 第33-34页 |
3.4 基于C4.5 算法建立军事训练成绩评估模型 | 第34-45页 |
3.4.1 研究背景 | 第34-35页 |
3.4.2 系统分析 | 第35-36页 |
3.4.3 模型建立 | 第36-45页 |
3.4.4 模型评估 | 第45页 |
3.5 基于罗比达法则的决策树算法改进 | 第45-55页 |
3.5.1 C4.5 测试属性的选择 | 第45-46页 |
3.5.2 C4.5 算法的改进算法研究现状 | 第46页 |
3.5.3 C4.5 算法的改进 | 第46-51页 |
3.5.4 实验验证 | 第51-55页 |
3.5.5 实验结论 | 第55页 |
3.6 本章小结 | 第55-56页 |
第四章 决策树算法的并行化研究 | 第56-73页 |
4.1 随机森林算法 | 第56-58页 |
4.2 基于CART算法的随机森林模型构建 | 第58-60页 |
4.2.1 CART算法 | 第58-59页 |
4.2.2 模型构建 | 第59-60页 |
4.3 算法并行化研究 | 第60-63页 |
4.3.1 并行计算模型 | 第60-61页 |
4.3.2 MapReduce并行编程模型 | 第61-63页 |
4.4 基于随机森林的CART算法并行化设计 | 第63-68页 |
4.4.1 并行策略的选取 | 第63-64页 |
4.4.2 基于Map Reduce模型的算法设计 | 第64页 |
4.4.3 并行模型相关函数设计 | 第64-66页 |
4.4.4 改进算法基于MapReduce的流程设计 | 第66-68页 |
4.5 实验与分析 | 第68-72页 |
4.5.1 实验数据选择 | 第68-69页 |
4.5.2 算法参数选择 | 第69-70页 |
4.5.3 建树属性数量的设置 | 第70-71页 |
4.5.4 算法性能对比 | 第71-72页 |
4.6 本章小结 | 第72-73页 |
第五章 基于Hadoop平台的决策树算法实验与评估 | 第73-80页 |
5.1 实验平台搭建 | 第73-77页 |
5.1.1 实验环境 | 第73页 |
5.1.2 Hadoop平台搭建 | 第73-76页 |
5.1.3 平台状态显示 | 第76-77页 |
5.2 实验数据 | 第77页 |
5.3 实验评价 | 第77-80页 |
第六章 总结与展望 | 第80-82页 |
6.1 论文总结 | 第80页 |
6.2 展望 | 第80-82页 |
致谢 | 第82-83页 |
参考文献 | 第83-86页 |