首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于随机森林的大数据下数据缺失插补方法

摘要第3-4页
abstract第4页
第1章 绪论第9-15页
    1.1 研究背景及意义第9页
    1.2 国内外研究现状第9-11页
        1.2.1 国外研究现状第10页
        1.2.2 国内研究现状第10-11页
    1.3 本文主要工作及创新点第11-13页
    1.4 论文结构第13-15页
第2章 现有缺失数据处理方法第15-19页
    2.1 删除元组第15页
    2.2 数据插补第15-17页
    2.3 不处理第17页
    2.4 本章小结第17-19页
第3章 随机森林第19-29页
    3.1 决策树第19-23页
        3.1.1 决策树基本原理第19-20页
        3.1.2 决策树的构造算法第20-21页
        3.1.3 CART算法第21-22页
        3.1.4 决策树的剪枝第22-23页
    3.2 集成学习第23-24页
    3.3 随机森林第24-26页
        3.3.1 随机森林算法原理第24-25页
        3.3.2 构建流程第25-26页
    3.4 随机森林性能和特点第26-27页
        3.4.1 out-of-bag估计第26页
        3.4.2 变量重要性度量第26-27页
        3.4.3 随机特征选取第27页
    3.5 本章小结第27-29页
第4章 多重回归第29-37页
    4.1 多重回归模型第29页
    4.2 参数估计第29-31页
    4.3 回归方程的显著性验证第31-33页
    4.4 自变量的选择第33页
    4.5 共线性解决方案与校正第33-35页
        4.5.1 多重共线性的诊断第34-35页
        4.5.2 共线性解决方案第35页
    4.6 利用回归方程进行预测第35-36页
    4.7 本章小结第36-37页
第5章 随机森林缺失数据插补方法研究第37-42页
    5.1 基准插补第37页
    5.2 Proximity imputation第37-38页
    5.3 on-the-fly-imputation(OTFI)第38页
    5.4 改进算法第38-40页
        5.4.1 随机森林构建改进第38-40页
        5.4.2 剪枝算法改进第40页
    5.5 本章小结第40-42页
第6章 实验设计第42-49页
    6.1 实验数据来源第42页
    6.2 实验环境第42-43页
    6.3 实验设计第43-48页
        6.3.1 缺失机制第43-46页
        6.3.2 缺失率设计第46-47页
        6.3.3 插补精度测量第47页
        6.3.4 参数设置第47-48页
    6.4 本章小结第48-49页
第7章 实验结论第49-55页
    7.1 插补精度第49-52页
    7.2 计算时间第52-53页
    7.3 本章小结第53-55页
总结与未来展望第55-56页
    工作总结第55页
    未来展望第55-56页
致谢第56-57页
攻读硕士学位期间取得的研究成果第57-58页
参考文献第58-62页
个人简介第62-63页

论文共63页,点击 下载论文
上一篇:基于STM32的配电网远动终端(RTU)的设计
下一篇:基于遗传算法的高校运动会系统的应用与研究