首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文--自动推理、机器学习论文

基于Spark分布式平台的随机森林分类算法研究

摘要第6-7页
Abstract第7-8页
第一章 绪论第12-19页
    1.1 研究背景及意义第12-13页
    1.2 国内外研究现状第13-17页
        1.2.1 Spark分布式平台研究及应用现状第13-14页
        1.2.2 随机森林分类算法研究现状第14-17页
    1.3 本文的主要工作第17页
    1.4 本文组织结构第17-19页
第二章 基础理论第19-28页
    2.1 随机森林算法第19-25页
        2.1.1 决策树第19-22页
        2.1.2 随机森林算法流程第22-24页
        2.1.3 随机森林算法分析第24-25页
    2.2 Spark分布式平台第25-27页
    2.3 本章小结第27-28页
第三章 基于权重树的随机森林算法及其并行化第28-47页
    3.1 问题描述第28页
    3.2 权重树集成策略第28-31页
        3.2.1 袋内数据和袋外数据第28-29页
        3.2.2 度量分类能力第29-31页
        3.2.3 权重树集成策略模型第31页
    3.3 权重树随机森林算法流程第31-32页
    3.4 算法的并行化第32-34页
    3.5 实验结果与分析第34-46页
        3.5.1 实验环境第34-36页
        3.5.2 实验评价标准第36-38页
        3.5.3 实验数据集第38页
        3.5.4 随机森林参数选择第38-43页
        3.5.5 实验结果及分析第43-46页
    3.6 本章小结第46-47页
第四章 基于分层子空间的随机森林算法及其并行化第47-62页
    4.1 问题描述第47-48页
    4.2 分层子空间策略第48-53页
        4.2.1 度量特征与类别的相关性第48-49页
        4.2.2 分层子空间第49-50页
        4.2.3 分层子空间策略的实施方式第50-53页
    4.3 分层子空间随机森林算法流程第53-55页
    4.4 算法的并行化第55-56页
    4.5 实验结果与分析第56-60页
        4.5.1 实验环境第56页
        4.5.2 实验评价标准第56页
        4.5.3 实验数据集第56-57页
        4.5.4 随机森林参数选择第57页
        4.5.5 实验结果及分析第57-60页
    4.6 本章小结第60-62页
第五章 改进的随机森林算法在航班延误中的应用第62-69页
    5.1 概述第62-63页
    5.2 数据集描述第63-65页
    5.3 数据预处理第65-66页
        5.3.1 特征规范化第65页
        5.3.2 航班延误等级划分第65-66页
    5.4 实验结果及分析第66-68页
    5.5 本章小结第68-69页
第六章 总结与展望第69-71页
参考文献第71-75页
致谢第75-76页
攻读硕士期间所发表的论文第76页

论文共76页,点击 下载论文
上一篇:IMA分区通信机制的一致性测试方法研究
下一篇:基于交通流的繁忙空域临时航线规划方法研究