首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop平台的决策树算法并行化研究

摘要第1-7页
ABSTRACT第7-12页
第一章 引言第12-17页
   ·课题研究背景第12页
   ·云计算的发展现状第12-14页
   ·数据挖掘的研究现状第14-15页
   ·决策树算法并行化的意义第15-16页
   ·论文的研究内容及体系结构第16-17页
第二章 云计算平台概述第17-29页
   ·Google的云计算平台第17-20页
     ·GFS文件系统第17-18页
     ·MapReduce编程模型第18-19页
     ·BigTable第19页
     ·Chubby锁机制第19页
     ·Google云计算平台特性第19-20页
   ·IBM的“蓝云”平台第20-22页
     ·“蓝云”的虚拟化技术第21页
     ·“蓝云”的存储结构第21页
     ·“蓝云”平台特性第21-22页
   ·abiCloud云计算平台第22-23页
     ·abiCloud的体系结构第22-23页
     ·abiCloud平台特性第23页
   ·Hadoop云计算平台第23-29页
     ·Hadoop的文件系统第23-24页
     ·HDFS的体系结构第24-25页
     ·Hadoop的MapReduce第25-27页
     ·Hadoop平台特性第27-29页
第三章 决策树算法研究第29-36页
   ·决策树概述第29-30页
   ·决策树的学习过程第30-31页
   ·决策树分割属性的方法第31-33页
     ·信息增益分类法第31-32页
     ·基尼指标分类法第32-33页
   ·决策树常用算法及比较第33-36页
     ·ID3算法第33-34页
     ·CART算法第34页
     ·SLIQ算法第34-35页
     ·常用决策树算法比较第35-36页
第四章 HaC4.5算法的Hadoop并行化及实现第36-50页
   ·C4.5算法基本思想第36-38页
     ·分裂属性选择第36-37页
     ·建树过程第37-38页
   ·HaC4.5算法的并行化实现第38-42页
     ·数据预处理第38-40页
     ·构建训练模型第40-42页
   ·Hadoop平台搭建及配置第42-46页
   ·实验结果及分析第46-50页
第五章 HaSPRINT算法的Hadoop并行化及实现第50-60页
   ·SPRINT算法的基本思想第50-53页
     ·数据结构第50-51页
     ·建树过程第51-52页
     ·最佳分割点选择第52-53页
   ·HaSPRINT算法的并行化实现第53-56页
     ·算法改进第53-54页
     ·算法在Hadoop平台的部署第54-56页
     ·实验数据第56页
   ·实验结果及分析第56-60页
第六章 总结与展望第60-61页
参考文献第61-64页
致谢第64-65页
附录1 攻读学位期间发表的论文及参与的科研项目目录第65页

论文共65页,点击 下载论文
上一篇:循环经济下投资决策方法的选择
下一篇:BPEL语言形式语义连接的仿真