内容摘要 | 第5-6页 |
Abstract | 第6页 |
第1章 导论 | 第10-18页 |
1.1 研究背景与意义 | 第10-11页 |
1.1.1 研究背景 | 第10-11页 |
1.1.2 研究意义 | 第11页 |
1.2 研究方法与思路 | 第11-13页 |
1.2.1 研究方法 | 第11-12页 |
1.2.2 研究思路 | 第12页 |
1.2.3 文章创新点 | 第12-13页 |
1.3 文献综述 | 第13-18页 |
1.3.1 P2P网贷信用认证及评分指标体系国内外研究综述 | 第13-14页 |
1.3.2 P2P网贷信用评分模型应用国内外综述 | 第14-18页 |
第2章 P2P网贷信用风险及决策树理论 | 第18-30页 |
2.1 P2P网络借贷理论 | 第18-23页 |
2.1.1 P2P网贷定义及借贷流程 | 第18-19页 |
2.1.2 P2P网贷主要运作模式 | 第19-23页 |
2.2 P2P网贷信用风险相关理论 | 第23-25页 |
2.2.1 信息不对称理论 | 第23页 |
2.2.2 金融脱媒理论 | 第23-24页 |
2.2.3 社会交换理论 | 第24页 |
2.2.4 信用风险理论 | 第24页 |
2.2.5 刚性兑付理论 | 第24-25页 |
2.3 决策树算法基本原理 | 第25-30页 |
2.3.1 决策树算法介绍 | 第25-26页 |
2.3.2 决策树各算法原理 | 第26-30页 |
第3章 基于C5.0算法的网贷个人信用评分模型构建 | 第30-39页 |
3.1 数据抓取及数据预处理 | 第30-33页 |
3.1.1 评分数据抓取 | 第30页 |
3.1.2 数据预处理 | 第30-33页 |
3.2 评分指标体系构建 | 第33-37页 |
3.2.1 评分指标字段归类及字段信息 | 第33-35页 |
3.2.2 评分指标字段统计性描述 | 第35-37页 |
3.3 基于训练样本集的C5.0决策树模型构建 | 第37-39页 |
3.3.1 确定训练样本信息熵及分类属性条件熵 | 第37-38页 |
3.3.2 确定训练集分类属性信息增益率 | 第38-39页 |
第4章 P2P网贷个人信用评分的实现 | 第39-48页 |
4.1 初始C5.0模型分类结果 | 第39-40页 |
4.1.1 训练样本集初始预测结果 | 第39页 |
4.1.2 变量处理前后分类预测对比 | 第39-40页 |
4.2 基于Cost-senstive tree成本矩阵的模型改进 | 第40-42页 |
4.2.1 评分分类中的误判成本 | 第40页 |
4.2.2 基于成本矩阵的决策树模型改进 | 第40-42页 |
4.3 基于剪枝及Boosting技术的模型改进 | 第42-43页 |
4.3.1 剪枝技术改进处理 | 第42-43页 |
4.3.2 Boosting技术改进 | 第43页 |
4.4 经改进的最终决策树模型 | 第43-48页 |
4.4.1 决策树生长模型 | 第43-46页 |
4.4.2 变量重要性 | 第46-48页 |
第5章 结论及展望 | 第48-51页 |
5.1 结论与建议 | 第48-50页 |
5.1.1 有序对接央行征信系统 | 第48-49页 |
5.1.2 加强与第三方征信合作力度 | 第49-50页 |
5.1.3 推行大数据征信 | 第50页 |
5.2 展望与不足 | 第50-51页 |
参考文献 | 第51-54页 |
后记 | 第54页 |