个人信用评估模型实证分析
中文摘要 | 第3-4页 |
英文摘要 | 第4页 |
1 绪论 | 第7-10页 |
1.1 选题背景 | 第7页 |
1.2 研究意义及目的 | 第7-8页 |
1.2.1 研究意义 | 第7-8页 |
1.2.2 研究目的 | 第8页 |
1.3 国内外研究现状 | 第8-9页 |
1.3.1 国外研究现状 | 第8页 |
1.3.2 国内研究现状 | 第8-9页 |
1.4 研究内容 | 第9-10页 |
2 P2P网络借贷中的基本概念 | 第10-13页 |
2.1 P2P的基本定义 | 第10页 |
2.2 P2P网络借贷的发展历程 | 第10-11页 |
2.3 网络借贷中信用违约风险的基本概念 | 第11-12页 |
2.4 大数据在信用风险中的基本应用 | 第12-13页 |
2.4.1 大数据的概念 | 第12页 |
2.4.2 大数据在信用评估中的主要应用 | 第12-13页 |
3 理论概述 | 第13-21页 |
3.1 数据预处理 | 第13-17页 |
3.1.1 非平衡样本的处理 | 第13页 |
3.1.2 数据清洗 | 第13-14页 |
3.1.3 数据变换 | 第14-15页 |
3.1.4 数据规约 | 第15-17页 |
3.2 逻辑回归 | 第17-18页 |
3.2.1 逻辑回归模型原理 | 第17-18页 |
3.2.2 逻辑回归中权重问题 | 第18页 |
3.3 随机森林算法 | 第18-21页 |
3.3.1 决策树 | 第19-20页 |
3.3.2 Gini指数 | 第20页 |
3.3.3 决策树的剪枝 | 第20-21页 |
4 数据的收集与处理 | 第21-28页 |
4.1 数据介绍与描述 | 第21-23页 |
4.1.1 数据的描述性统计 | 第21-22页 |
4.1.2 训练集和测试集的划分 | 第22页 |
4.1.3 变量描述 | 第22-23页 |
4.2 数据的预处理 | 第23-28页 |
4.2.1 缺失值及数据格式化 | 第25页 |
4.2.2 离散变量的分箱 | 第25页 |
4.2.3 连续变量的离散化 | 第25-28页 |
5 个人信用评估模型的搭建 | 第28-39页 |
5.1 个人信用评估模型的搭建流程 | 第28页 |
5.2 变量挑选过程 | 第28-31页 |
5.2.1 单变量分析——基于IV信息度 | 第28-30页 |
5.2.2 多变量分析 | 第30-31页 |
5.3 逻辑回归模型 | 第31-35页 |
5.3.1 逻辑回归模型的搭建 | 第31-32页 |
5.3.2 模型评估 | 第32-35页 |
5.4 随机森林模型 | 第35-39页 |
5.4.1 模型搭建 | 第35-36页 |
5.4.2 参数调整 | 第36-39页 |
6 总结 | 第39-41页 |
6.1 研究内容总结 | 第39-40页 |
6.2 不足与展望 | 第40-41页 |
致谢 | 第41-42页 |
参考文献 | 第42-43页 |