中文摘要 | 第3-4页 |
英文摘要 | 第4-5页 |
1 绪论 | 第8-11页 |
1.1 课题意义 | 第8页 |
1.2 国内外研究现状 | 第8-11页 |
1.2.1 国外研究综述 | 第8-9页 |
1.2.2 国内研究综述 | 第9-11页 |
2 数据处理 | 第11-22页 |
2.1 数据说明与探索 | 第11-15页 |
2.2 缺失值处理 | 第15-18页 |
2.3 异常值处理 | 第18-19页 |
2.4 数据规范化处理 | 第19-20页 |
2.5 不平衡数据的处理 | 第20-22页 |
2.5.1 SMOTE算法简介 | 第20页 |
2.5.2 SMOTE算法的实施 | 第20-22页 |
3 基于机器学习的信用评估模型的建立 | 第22-39页 |
3.1 模型的评价标准——AUC值 | 第22-23页 |
3.2 构建Logistic回归模型 | 第23-32页 |
3.2.1 Logistic回归模型简介 | 第23-24页 |
3.2.2 基于IV值的变量选择 | 第24-30页 |
3.2.3 Logistic回归模型的建立 | 第30-32页 |
3.3 构建随机森林模型 | 第32-36页 |
3.3.1 随机森林模型简介 | 第32-33页 |
3.3.2 随机森林模型的建立 | 第33-36页 |
3.4 构建支持向量机模型 | 第36-39页 |
3.4.1 支持向量机原理简介 | 第36页 |
3.4.2 支持向量机模型的建立 | 第36-39页 |
4 模型的验证 | 第39-42页 |
4.1 k折交叉验证简介 | 第39页 |
4.2 验证结果对比分析与小结 | 第39-42页 |
5 基于Logistic回归模型的SMOTE算法的改进 | 第42-45页 |
5.1 SMOTE算法的不足 | 第42页 |
5.2 改进思路 | 第42页 |
5.3 改进实施 | 第42-44页 |
5.4 交叉验证 | 第44-45页 |
6 总结 | 第45-46页 |
致谢 | 第46-47页 |
参考文献 | 第47-48页 |