首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop平台的决策树算法研究

摘要第4-5页
Abstract第5-6页
第一章引言第9-16页
    1.1 课题的研究背景及意义第9-10页
    1.2 研究现状第10-14页
        1.2.1 Hadoop的研究现状第10-11页
        1.2.2 数据挖掘的研究现状第11-12页
        1.2.3 数据挖掘算法并行化的研究现状第12-14页
    1.3 论文的研究内容与体系结构第14-15页
        1.3.1 论文的研究内容第14页
        1.3.2 论文的体系结构第14-15页
    1.4 本章小结第15-16页
第二章 Hadoop平台及数据挖掘概述第16-34页
    2.1 Hadoop技术第16-18页
    2.2 HDFS分布式文件系统第18-22页
        2.2.1 HDFS系统框架第18-19页
        2.2.2 HDFS的数据读取过程第19-20页
        2.2.3 数据写入过程第20-22页
    2.3 MapReduce并行编程模型第22-26页
        2.3.1 MapReduce原理第22-24页
        2.3.2 MapReduce工作机制第24-26页
    2.4 数据挖掘第26-28页
        2.4.1 知识发现和数据挖掘的概念第26-28页
        2.4.2 数据挖掘算法的特性第28页
    2.5 决策树概述第28-33页
        2.5.1 决策树构建第29-32页
        2.5.2 决策树分类第32-33页
    2.6 本章小结第33-34页
第三章 Hadoop平台上的C4.5bH算法的研究和实现第34-50页
    3.1 C4.5 算法第34-38页
        3.1.1 C4.5 算法的出现背景第34页
        3.1.2 C4.5 算法模型第34-35页
        3.1.3 C4.5 算法建树过程第35-38页
    3.2 C4.5 算法的并行化设计第38-42页
        3.2.1 并行策略第38-39页
        3.2.2 并行设计第39-41页
        3.2.3 算法分析第41-42页
    3.3 Hadoop实验平台的搭建与配置第42-45页
        3.3.1 环境配置第42页
        3.3.2 Hadoop平台的搭建第42-45页
    3.4 C4.5bH算法的实验分析第45-48页
    3.5 本章小结第48-50页
第四章 Hadoop平台上的SPRINTbH算法的研究和实现第50-60页
    4.1 SPRINT算法模型第50-52页
        4.1.1 SPRINT算法的数据结构第50-51页
        4.1.2 计算最佳分裂第51页
        4.1.3 执行节点的分裂第51-52页
    4.2 SPRINT算法的并行化设计第52-57页
        4.2.1 并行策略第52页
        4.2.2 并行设计第52-56页
        4.2.3 算法分析第56-57页
    4.3 SPRINTbH算法的实验分析第57-59页
    4.4 本章小结第59-60页
第五章基于Hadoop平台的CSbH算法的研究与实现第60-66页
    5.1 CS算法的研究与实现第60-62页
        5.1.1 数据结构的选择第60-61页
        5.1.2 最佳分割属性的选择第61-62页
        5.1.3 CS算法的实验分析第62页
    5.2 CSbH算法的研究与实现第62-65页
        5.2.1 CSbH算法的并行化实现第62-63页
        5.2.2 CSbH算法的实验分析第63-65页
    5.3 本章小结第65-66页
第六章总结与展望第66-68页
    6.1 本文研究总结第66-67页
    6.2 未来工作展望第67-68页
参考文献第68-71页
附录1 攻读硕士学位期间撰写的论文第71-72页
附录2 攻读硕士学位期间参加的科研项目第72-73页
致谢第73页

论文共73页,点击 下载论文
上一篇:SDN的网络虚拟化资源分配技术
下一篇:基于小波变换的图像特征提取方法研究