首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

Spark平台下的基于随机森林算法的用户贷款风险预测研究

摘要第4-5页
Abstract第5页
第一章 绪论第8-14页
    1.1 研究背景第8页
    1.2 国内外研究现状第8-11页
    1.3 研究目标与研究方法第11-12页
    1.4 研究内容第12页
    1.5 论文的组织第12-14页
第二章 相关理论及技术基础第14-20页
    2.1 分类算法第14-15页
        2.1.1 决策树算法第14页
        2.1.2 随机森林算法第14-15页
        2.1.3 XGBoost算法第15页
    2.2 模型融合方法第15-16页
    2.3 Spark计算平台第16-19页
        2.3.1 ApacheSpark大数据平台简介第16页
        2.3.2 Spark的组件第16-17页
        2.3.3 Spark的RDD第17页
        2.3.4 Spark的MLlib第17-19页
    2.4 本章小结第19-20页
第三章 用户贷款风险预测模型设计第20-26页
    3.1 用户贷款风险评估指标体系第20-21页
        3.1.1 贷款风险分析第20页
        3.1.2 贷款风险评估指标第20-21页
    3.2 随机森林模型第21-25页
        3.2.1 决策树第21-24页
        3.2.2 随机森林并行化第24-25页
    3.3 本章小结第25-26页
第四章 用户贷款风险等级预测模型实现第26-42页
    4.1 Spark平台搭建第26-29页
        4.1.1 Linux系统配置第26-27页
        4.1.2 Spark平台搭建第27-28页
        4.1.3 Scala环境搭建第28-29页
    4.2 数据准备第29-35页
        4.2.1 数据获取第29-30页
        4.2.2 数据预处理第30页
        4.2.3 特征提取第30-33页
        4.2.4 特征选择第33-35页
    4.3 数据导入Spark平台第35-37页
        4.3.1 数据导入第35-36页
        4.3.2 数据解析第36-37页
    4.4 Spark平台下随机森林并行化第37-39页
    4.5 模型优化第39-41页
        4.5.1 参数调优第39页
        4.5.2 模型选择第39-41页
    4.6 本章小结第41-42页
第五章 实验结果分析第42-47页
    5.1 实验描述第42-44页
        5.1.1 实验环境第42页
        5.1.2 实验数据第42-43页
        5.1.3 评估标准第43-44页
    5.2 实验结果及分析第44-46页
    5.3 本章小结第46-47页
第六章 总结与展望第47-49页
参考文献第49-52页
致谢第52-53页
在学期间公开发表论文及著作情况第53页

论文共53页,点击 下载论文
上一篇:基于Hadoop的图像类教学资源的检索策略研究
下一篇:支持移动学习的屏幕共享策略研究