首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的决策树挖掘算法的研究

中文摘要第3-4页
Abstract第4-5页
第一章 绪论第8-13页
    1.1 研究背景和意义第8-9页
    1.2 国内外研究现状第9-11页
        1.2.1 云计算技术发展现状第9-10页
        1.2.2 数据挖掘研究现状第10-11页
    1.3 研究目标及内容第11页
    1.4 论文结构第11-13页
第二章 云计算技术概论第13-21页
    2.1 云计算定义第13页
    2.2 云计算特点第13-14页
    2.3 云计算关键技术第14-16页
    2.4 Hadoop平台第16-19页
        2.4.1 HDFS体系架构第17-18页
        2.4.2 MapReduce体系架构第18-19页
    2.5 小结第19-21页
第三章 数据挖掘算法研究第21-27页
    3.1 数据挖掘概述第21-22页
    3.2 数据挖掘方法第22-25页
        3.2.1 聚类分析方法第22-23页
        3.2.2 预测建模方法第23-24页
        3.2.3 异常检测算法第24页
        3.2.4 关联分析算法第24-25页
    3.3 决策树分类算法第25-26页
    3.4 小结第26-27页
第四章 基于RainForest的改进算法IRSPRINT第27-41页
    4.1 SPRINT算法第27-30页
    4.2 RainForest算法框架第30-34页
        4.2.1 雨林算法框架的流程第30-31页
        4.2.2 RainForest算法框架采用的数据结构第31-32页
        4.2.3 雨林算法综述第32-34页
    4.3 IRSPRINT算法第34-38页
        4.3.1 改进数据结构第34-36页
        4.3.2 划分数据集第36-37页
        4.3.3 IRSPRINT算法总体框架第37-38页
    4.4 实验结果分析第38-40页
        4.4.1 实验硬件条件第38页
        4.4.2 实验数据集第38-39页
        4.4.3 算法性能评估第39-40页
    4.5 小结第40-41页
第五章 基于Hadoop的并行化改进算法HIRSPRINT第41-54页
    5.1 IRSPRINT算法并行化方案第41-42页
        5.1.1 数据集预处理并行方案第42页
        5.1.2 决策树构建阶段并行方案第42页
    5.2 HIRSPRINT算法第42-48页
        5.2.1 数据预处理阶段第43-45页
        5.2.2 根节点分裂第45-47页
        5.2.3 子节点分裂第47-48页
    5.3 实验分析第48-53页
        5.3.1 硬件描述第48-49页
        5.3.2 软件描述第49页
        5.3.3 Hadoop平台搭建第49-50页
        5.3.4 HIRSPRINT算法实验第50-53页
    5.4 小结第53-54页
第六章 总结与展望第54-56页
    6.1 总结第54页
    6.2 展望第54-56页
参考文献第56-58页
致谢第58页

论文共58页,点击 下载论文
上一篇:基于粗糙集的网络安全态势感知方法研究
下一篇:Linux中一种新型同步机制的研究