双权重随机森林预测算法及其并行化研究

摘要	第4-5页
ABSTRACT	第5页
第1章绪论	第8-14页
1.1 研究背景和意义	第8-9页
1.2 国内外相关研究和综述	第9-12页
1.2.1 随机森林算法	第9-10页
1.2.2 分布式计算平台及算法的并行化	第10-11页
1.2.3 问题分析和总结	第11-12页
1.3 本文主要工作	第12-13页
1.4 本文组织结构	第13-14页
第2章相关基础知识	第14-25页
2.1 随机森林回归算法	第14-18页
2.1.1 CART-分类与回归树	第14-15页
2.1.2 随机森林回归算法	第15-18页
2.2 SPARK分布式计算平台	第18-22页
2.2.1 Spark生态系统	第18-19页
2.2.2 Spark运行模式与基本的工作流程	第19-20页
2.2.3 Spark RDD	第20-22页
2.3 常用的回归算法评价指标	第22-23页
2.4 本章小结	第23-25页
第3章双权重随机森林回归算法	第25-54页
3.1 随机森林相关算法的问题分析	第25-26页
3.2 DWRFR算法的流程	第26-31页
3.3 带权重的特征抽样	第31-36页
3.3.1 RReliefF算法	第31-34页
3.3.2 带权重特征抽取方法	第34-36页
3.4 带权重的模型集成	第36-41页
3.4.1 有放回的向前搜索方法	第36-39页
3.4.2 基于多样性计算的方法	第39-41页
3.5 实验结果与分析	第41-53页
3.5.1 实验环境	第41页
3.5.2 实验数据	第41-42页
3.5.3 评价指标	第42页
3.5.4 对比算法介绍	第42-43页
3.5.5 实验结果与分析	第43-53页
3.6 本章小结	第53-54页
第4章双权重随机森林回归算法的并行化	第54-62页
4.1 并行化设计	第54-57页
4.1.1 随机森林回归建树并行化	第54页
4.1.2 特征权重计算并行化	第54-55页
4.1.3 分类回归树模型权重计算并行化	第55-56页
4.1.4 随机森林回归带权重的模型集成并行化	第56-57页
4.2 实验结果与分析	第57-61页
4.2.1 实验环境	第57-59页
4.2.2 实验数据	第59页
4.2.3 评价指标	第59页
4.2.4 实验结果与分析	第59-61页
4.3 本章小结	第61-62页
结论	第62-63页
参考文献	第63-68页
致谢	第68页