基于分布式的决策树方法研究
摘要 | 第1-6页 |
ABSTRACT | 第6-11页 |
第一章 引言 | 第11-15页 |
·课题背景及意义 | 第11-12页 |
·决策树方法研究现状 | 第12-13页 |
·作者所做工作 | 第13-14页 |
·本文组织结构 | 第14-15页 |
第二章 决策树方法概述 | 第15-38页 |
·决策树的创建 | 第15-28页 |
·经典决策树算法ID3 和C4.5 | 第15-19页 |
·决策树算法的可规模性 | 第19-23页 |
·并行决策树算法 | 第23-28页 |
·决策树的剪枝 | 第28-31页 |
·基于MDL 的剪枝方法 | 第29-31页 |
·雨林算法框架 | 第31-37页 |
·雨林算法的一般过程 | 第33-34页 |
·RF-Write 算法 | 第34-35页 |
·RF-Read 算法 | 第35-36页 |
·RF-Hybrid 算法 | 第36-37页 |
·本章小结 | 第37-38页 |
第三章 C&R 树归导算法研究与改进 | 第38-51页 |
·基本概念与定义 | 第38-42页 |
·树模型 | 第38-39页 |
·树模型学习 | 第39-40页 |
·回归树 | 第40-42页 |
·节点最佳分割谓词选择和评估 | 第42-48页 |
·分类树的连续属性的分割谓词 | 第42-45页 |
·分类树的离散属性的分割谓词 | 第45-47页 |
·回归树的离散属性的分割谓词 | 第47-48页 |
·回归树的连续属性的分割谓词 | 第48页 |
·算法流程 | 第48-49页 |
·本章小结 | 第49-51页 |
第四章 并行可扩展决策树算法设计 | 第51-65页 |
·可扩展性的定义 | 第51-52页 |
·可扩展性的一般描述 | 第51-52页 |
·本文对可扩展性问题的要求 | 第52页 |
·Hadoop 分布式计算平台 | 第52-54页 |
·分布式文件系统HDFS | 第53-54页 |
·MapReduce 并行编程框架 | 第54页 |
·并行树模型学习算法示例 | 第54-57页 |
·组件 | 第55-56页 |
·树模型归导过程 | 第56-57页 |
·并行树模型归导算法设计细节 | 第57-64页 |
·MR_SplitENodes | 第57-62页 |
·MR_SplitINodes:驻留内存的树归导 | 第62页 |
·控制器设计 | 第62-64页 |
·本章小结 | 第64-65页 |
第五章 实验 | 第65-70页 |
·实验环境与数据 | 第65-66页 |
·单机条件下的性能 | 第66页 |
·并行环境下的性能 | 第66-69页 |
·增加处理器数量对时间的影响 | 第67-68页 |
·并行算法的加速性能 | 第68页 |
·增加样本数量对性能的影响 | 第68-69页 |
·本章小结 | 第69-70页 |
第六章 总结与展望 | 第70-72页 |
·本文总结 | 第70页 |
·展望 | 第70-72页 |
致谢 | 第72-73页 |
参考文献 | 第73-77页 |