首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于Hadoop的决策树算法改进及林业数据分类预测研究

摘要第4-5页
Abstract第5-6页
1 绪论第9-16页
    1.1 研究背景和意义第9-10页
    1.2 国内外研究现状及分析第10-13页
    1.3 本文的工作第13-14页
    1.4 本文的组织结构第14-16页
2 相关技术的研究与分析第16-36页
    2.1 数据挖掘概述第16-23页
        2.1.1 数据挖掘定义与特点第16-18页
        2.1.2 数据挖掘的一般步骤第18-20页
        2.1.3 常用的数据挖掘算法介绍第20-23页
    2.2 Hadoop平台研究第23-31页
        2.2.1 Hadoop平台简介第23-25页
        2.2.2 MapReduce工作原理及其执行流程第25-28页
        2.2.3 HDFS文件系统第28-31页
    2.3 决策树算法介绍与分析第31-34页
    2.4 本章小结第34-36页
3 基于Hadoop的决策树算法改进及其并行化设计第36-49页
    3.1 相关信息论的数学定义第36-37页
    3.2 改进算法IP-C4.5建模第37-40页
        3.2.1 基于信息论的IGR数学模型构建第37-38页
        3.2.2 融合不确定概率理论的IP-IGR数学模型第38-40页
    3.3 改进算法IP-C4.5的实现第40-43页
    3.4 基于Hadoop的IP-C4.5算法实现第43-48页
        3.4.1 IP-C4.5算法并行化设计思想第43-45页
        3.4.2 IP-C4.5算法具体实现第45-48页
    3.5 本章小结第48-49页
4 实验结果验证及林业数据分类应用第49-68页
    4.1 实验环境与操作方法第49-55页
        4.1.1 Hadoop平台搭建第49-54页
        4.1.2 实验操作方式第54-55页
    4.2 算法正确率与性能验证及分析第55-60页
        4.2.1 串行实验设计与分析第55-57页
        4.2.2 并行实验设计与分析第57-58页
        4.2.3 并行算法性能验证第58-60页
    4.3 基于Hadoop的IP-C4.5算法预测森林成熟度第60-63页
        4.3.1 实验数据准备第60-61页
        4.3.2 实验分析与结果评估第61-63页
    4.4 基于Hadoop的IP-C4.5预测海量森林覆盖类型第63-67页
        4.4.1 实验数据准备第63-64页
        4.4.2 实验分析与结果评估第64-67页
    4.5 本章小结第67-68页
结论第68-69页
参考文献第69-72页
攻读学位期间发表的学术论文第72-73页
致谢第73-74页

论文共74页,点击 下载论文
上一篇:云计算环境下海量小文件处理方法研究
下一篇:改进C-V模型在叶缘图像分割中的应用