首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

基于随机森林的不平衡大数据分类算法研究

摘要第6-7页
Abstract第7-8页
第1章 绪论第11-17页
    1.1 课题研究背景与意义第11-12页
    1.2 国内外研究现状第12-14页
        1.2.1 不平衡大数据分类研究现状第12-14页
        1.2.2 随机森林算法的研究现状第14页
    1.3 本文研究内容第14-16页
    1.4 本文的章节安排第16-17页
第2章 不平衡大数据及相关算法概述第17-23页
    2.1 不平衡大数据集第17-18页
    2.2 重采样方法第18页
    2.3 代价敏感方法第18-19页
    2.4 随机森林算法第19-21页
    2.5 常用评价指标第21-22页
    2.6 本章小结第22-23页
第3章 基于类区分度的高维不平衡特征选择算法第23-32页
    3.1 K-means算法简介第23-24页
    3.2 相关特征选择算法第24-25页
        3.2.1 信息增益第24页
        3.2.2 卡方检验第24页
        3.2.3 互信息第24-25页
    3.3 基于类区分度的高维不平衡特征选择算法思想第25-26页
    3.4 基于类区分度的高维不平衡特征选择算法描述第26页
    3.5 实验结果及分析第26-31页
        3.5.1 实验数据集第26页
        3.5.2 分类器第26-27页
        3.5.3 实验结果及分析第27-31页
    3.6 本章小结第31-32页
第4章 基于代价敏感的随机森林分类算法第32-40页
    4.1 代价敏感随机森林第32页
    4.2 基于代价敏感的随机森林分类算法第32-35页
        4.2.1 算法思想第32-33页
        4.2.2 代价函数的构造第33-34页
        4.2.3 算法步骤第34-35页
    4.3 实验及结果分析第35-39页
        4.3.1 实验数据集第35页
        4.3.2 实验结果分析第35-39页
    4.4 本章小结第39-40页
第5章 基于MapReduce的随机森林算法并行化设计第40-47页
    5.1 大数据处理平台第40-42页
        5.1.1 Hadoop简介第40-41页
        5.1.2 MapReduce模型第41-42页
    5.2 随机森林算法并行化设计第42-43页
    5.3 基于MapReduce的随机森林并行化设计描述第43-44页
    5.4 实验及结果分析第44-46页
        5.4.1 实验环境第44页
        5.4.2 实验数据集与评价指标第44-45页
        5.4.3 实验结果分析第45-46页
    5.5 本章小结第46-47页
结论第47-48页
参考文献第48-52页
攻读硕士学位期间发表的论文及其它成果第52-53页
致谢第53页

论文共53页,点击 下载论文
上一篇:物流场景中基于RGBD信息的物体分割
下一篇:大数据环境下文本数据相似重复记录检测方法研究