首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

面向高维不平衡数据的随机森林算法及其并行化研究

摘要第4-5页
ABSTRACT第5-6页
第1章 绪论第11-19页
    1.1 研究背景第11页
    1.2 国内外研究现状第11-15页
        1.2.1 高维不平衡数据研究现状第11-12页
        1.2.2 随机森林算法研究现状第12-13页
        1.2.3 分布式计算框架的研究现状第13-15页
    1.3 问题提出第15页
    1.4 研究目的及意义第15-17页
        1.4.1 研究目的第15-16页
        1.4.2 研究意义第16-17页
    1.5 本文主要工作第17页
    1.6 论文组织结构第17-19页
第2章 相关文献综述第19-35页
    2.1 高维数据概述第19-21页
        2.1.1 高维数据特点第19-20页
        2.1.2 维度归约第20-21页
    2.2 不平衡数据概述第21-24页
        2.2.1 不平衡数据特点第21-22页
        2.2.2 数据平衡化解决方法第22-24页
    2.3 随机森林算法概述第24-29页
        2.3.1 决策树第24-27页
        2.3.2 随机森林定义第27-28页
        2.3.3 随机森林生成过程第28-29页
        2.3.4 随机森林分析第29页
    2.4 Spark并行平台概述第29-34页
        2.4.1 Spark概述第30页
        2.4.2 Spark生态系统第30-32页
        2.4.3 Spark的编程模型第32-34页
    2.5 本章小结第34-35页
第3章 高维不平衡数据的平衡化处理方法第35-42页
    3.1 方法提出的动机第35-36页
    3.2 方法思想第36页
    3.3 相关概念第36-40页
        3.3.1 基于相似性度量的属性归约第37页
        3.3.2 样本集的空间分布状态第37-38页
        3.3.3 CS-SMOTE算法第38-40页
    3.4 高维不平衡数据的平衡化处理流程第40-41页
        3.4.1 数据平衡化方法设计第40页
        3.4.2 数据平衡化方法实现第40-41页
    3.5 本章小结第41-42页
第4章 面向高维数据的随机森林算法及其并行化实现第42-53页
    4.1 算法提出动机第42-43页
    4.2 算法思想第43-44页
    4.3 相关概念第44-46页
        4.3.1 图概念介绍第44-45页
        4.3.2 特征相似图第45-46页
    4.4 面向高维数据的随机森林算法流程第46-50页
        4.4.1 面向高维数据的随机森林算法流程设计第46-47页
        4.4.2 高维数据中特征子空间生成过程的设计第47-49页
        4.4.3 高维数据中特征子空间生成过程的实现第49-50页
    4.5 算法的并行化改进第50-52页
        4.5.1 基于Spark平台的算法并行化设计第50-51页
        4.5.2 基于Spark平台的算法并行化实现第51-52页
    4.6 本章小结第52-53页
第5章 实验设计与性能评价第53-62页
    5.1 实验数据描述第53-54页
    5.2 实验环境配置第54-55页
        5.2.1 Spark环境配置第54页
        5.2.2 实验环境第54-55页
    5.3 实验评价标准第55-57页
        5.3.1 分类测试指标第55-56页
        5.3.2 ROC曲线第56页
        5.3.3 算法加速比第56-57页
    5.4 实验结果与分析第57-61页
        5.4.1 实验结果第57-60页
        5.4.2 实验分析第60-61页
    5.5 本章小结第61-62页
第6章 总结与展望第62-64页
致谢第64-65页
参考文献第65-68页
攻读学位期间发表的学术论文以及参加科研情况第68页

论文共68页,点击 下载论文
上一篇:A公司软件研发敏捷项目管理改进研究
下一篇:内存数据库关键技术的研究与设计