首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机的应用论文--信息处理(信息加工)论文--文字信息处理论文

随机森林算法的优化研究及在文本并行分类上的应用

摘要第4-5页
abstract第5-6页
第一章 绪论第9-14页
    1.1 课题背景及研究意义第9-10页
    1.2 国内外研究综述第10-12页
        1.2.1 随机森林算法优化方法第10-11页
        1.2.2 并行分类第11-12页
    1.3 本文的主要内容和结构安排第12-14页
第二章 基本概念和基本理论第14-27页
    2.1 随机森林算法第14-21页
        2.1.1 基分类器—决策树第14-18页
        2.1.2 构建过程第18-19页
        2.1.3 随机性分析第19-20页
        2.1.4 性能指标第20-21页
    2.2 Hadoop简介第21-25页
        2.2.1 概述第21-22页
        2.2.2 生态系统第22-23页
        2.2.3 HDFS架构第23-24页
        2.2.4 Mapreduce架构第24-25页
    2.3 本章小结第25-27页
第三章 关于特征选择的优化研究第27-34页
    3.1 特征选择问题简述第27-28页
    3.2 随机森林内置的特征选择算法第28页
    3.3 Hadoop平台下基于随机森林的特征选择算法第28-31页
        3.3.1 算法基本描述第28-29页
        3.3.2 决策树的权重度量第29-30页
        3.3.3 算法的MapReduce并行化实现第30-31页
    3.4 Hadoop平台下基于随机森林的特征选择算法实验仿真第31-33页
        3.4.1 实验环境第31-32页
        3.4.2 评估指标第32页
        3.4.3 实验结果第32-33页
    3.5 本章小结第33-34页
第四章 关于数据非平衡问题的优化研究第34-47页
    4.1 非平衡数据问题概述第34-35页
    4.2 非平衡数据集分类问题的解决方法第35-39页
        4.2.1 通过改进算法解决非平衡问题第35-36页
        4.2.2 通过改造数据解决非平衡问题第36-39页
    4.3 随机森林处理非平衡数据分类问题的优化—M3C-SMOTE算法第39-42页
        4.3.1 k-means算法简介第39-40页
        4.3.2 M3C-SMOTE算法设计第40-42页
    4.4 M3C-SMOTE算法提升随机森林性能的验证分析第42-46页
        4.4.1 数据集第42页
        4.4.2 实验环境及步骤第42-43页
        4.4.3 实验评价指标第43-44页
        4.4.4 实验结果及分析第44-46页
    4.5 本章小结第46-47页
第五章 基于Hadoop平台的文本并行分类第47-66页
    5.1 文本分类概述第47-52页
        5.1.1 文本预处理第48页
        5.1.2 文本特征选择第48-50页
        5.1.3 文本向量化第50-51页
        5.1.4 常用的机器学习算法第51-52页
    5.2 基于Hadoop平台的分布式文本分类第52-62页
        5.2.1 并行文本分类中的问题分析第52-53页
        5.2.2 文本预处理并行化第53-55页
        5.2.3 文本特征选择并行化第55-58页
        5.2.4 文本向量化并行化第58-61页
        5.2.5 使用随机森林算法实现文本并行训练和分类第61-62页
    5.3 分布式文本分类实验及分析第62-65页
        5.3.1 实验环境第62-63页
        5.3.2 实验结果及分析第63-65页
    5.4 本章小结第65-66页
总结与展望第66-68页
参考文献第68-71页
附录 攻读硕士学位期间撰写的论文第71-72页
致谢第72页

论文共72页,点击 下载论文
上一篇:数字图像复制粘贴篡改盲检测研究
下一篇:钢丝绳芯输送带非均匀光照X光图像校正与接头抽动检测方法研究