首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

随机森林算法处理不平衡数据的改进及其并行化

摘要第4-5页
ABSTRACT第5页
第一章 绪论第11-15页
    1.1 课题的研究背景第11-12页
    1.2 国内外研究现状第12-14页
        1.2.1 将新的算法融合到随机森林算法中第12-13页
        1.2.2 对数据预处理来优化随机森林第13页
        1.2.3 对随机森林自身构建过程进行优化第13-14页
    1.3 本文的结构与主要内容第14-15页
        1.3.1 文本的主要工作第14页
        1.3.2 本文的结构第14-15页
第二章 基本概念和基本理论第15-30页
    2.1 决策树第15-20页
        2.1.1 决策树的定义第15页
        2.1.2 决策树生成过程中的节点分类算法第15-20页
        2.1.3 决策树分类中存着的问题第20页
    2.2 构建随机森林的步骤第20-23页
        2.2.1 单棵决策树样本抽样第21-22页
        2.2.2 单棵决策树的构建第22页
        2.2.3 森林的形成及算法的执行第22-23页
    2.3 随机森林的性能指标第23-24页
        2.3.1 分类效果系列指标第23-24页
        2.3.2 OOB估计第24页
    2.4 Hadoop简介第24-29页
        2.4.1 Hadoop生态系统第25-26页
        2.4.2 Hadoop概述第26页
        2.4.3 Hadoop HDFS架构第26-28页
        2.4.4 Hadoop Mapreduce框架第28-29页
    2.5 本章小结第29-30页
第三章 随机森林处理非平衡数据集的优化研究第30-39页
    3.1 非平衡数据简介第30-31页
    3.2 SMOTE算法和K-means简介第31-32页
        3.2.1 SMOTE算法第31页
        3.2.2 K-means算法第31-32页
    3.3 K_SMOTE算法原理及步骤第32-33页
    3.4 数据集来源第33-34页
    3.5 实验环境第34页
    3.6 实验流程第34-35页
        3.6.1 原始数据集的G-mean和F-value计算过程第34页
        3.6.2 新数据集的G-mean和F-value计算过程第34-35页
    3.7 实验结果及分析第35-36页
        3.7.1 F-value的测试实验第35页
        3.7.2 结果分析第35-36页
    3.8 G-mean的测试实验第36页
        3.8.1 G-mean的测试实验结果第36页
        3.8.2 结果分析第36页
    3.9 验证K-smote算法有效性验证第36-38页
        3.9.1 K-smote算法有效性的验证方法及结果第36-37页
        3.9.2 结果分析第37-38页
    3.10 结论第38-39页
第四章 基于Mapreduce框架随机森林算法并行化研究第39-43页
    4.1 数据集来源第40页
    4.2 实验环境第40-41页
    4.3 评价标准第41页
    4.4 实验结果及分析第41-42页
        4.4.1 实验结果第41-42页
        4.4.2 结果分析第42页
    4.5 结论第42-43页
结论和展望第43-44页
参考文献第44-47页
攻读硕士学位期间发表论文第47-49页
致谢第49页

论文共49页,点击 下载论文
上一篇:基于小波变换和DCT的图像压缩系统设计与实现
下一篇:基于轮廓形状和复杂网络的图像识别新方法