基于大数据的互联网金融欺诈行为识别研究
摘要 | 第4-5页 |
Abstract | 第5页 |
1 绪论 | 第8-13页 |
1.1 研究背景 | 第8-9页 |
1.1.1 互联网金融的现状及发展趋势 | 第8页 |
1.1.2 P2P行业的风险概述 | 第8-9页 |
1.2 研究意义 | 第9页 |
1.3 国内外研究现状 | 第9-10页 |
1.4 研究目的 | 第10-11页 |
1.5 研究内容 | 第11-12页 |
1.6 论文实验路线 | 第12页 |
1.7 创新之处 | 第12-13页 |
2 基于大数据的创新征信模式 | 第13-21页 |
2.1 互联网征信与欺诈识别 | 第14页 |
2.2 互联网征信及其发展 | 第14-16页 |
2.3 互联网行为数据与个人信用的关系 | 第16-17页 |
2.4 互联网征信的优劣分析 | 第17-21页 |
2.4.1 互联网征信的优势 | 第18-19页 |
2.4.2 互联网征信可能存在的问题 | 第19-21页 |
2.4.3 行业痛点 | 第21页 |
3 基于大数据的用户分类方法探究 | 第21-29页 |
3.1 数据爬虫 | 第21-23页 |
3.1.1 爬虫概述 | 第22页 |
3.1.2 爬虫在本文中的应用 | 第22-23页 |
3.2 随机森林 | 第23-27页 |
3.2.1 决策树算法概述 | 第24-25页 |
3.2.2 Bagging集成算法 | 第25页 |
3.2.3 随机森林算法概述 | 第25-26页 |
3.2.4 随机森林算法的实现过程 | 第26页 |
3.2.5 随机森林的优点 | 第26-27页 |
3.3 逻辑回归模型 | 第27-29页 |
3.3.1 Sigmoid函数 | 第27-28页 |
3.3.2 逻辑回归常规过程 | 第28-29页 |
4 实证分析 | 第29-47页 |
4.1 数据说明 | 第30-32页 |
4.1.1 数据整合 | 第30-31页 |
4.1.2 规则制定 | 第31-32页 |
4.2 各规则描述性统计 | 第32-33页 |
4.3 各规则评分及指标重要性度量 | 第33-36页 |
4.4 模型验证 | 第36-39页 |
4.5 计算信用评分 | 第39-41页 |
4.6 实证结论 | 第41页 |
4.7 逻辑回归建模及对比 | 第41-47页 |
4.7.1 参数估计 | 第41-44页 |
4.7.2 模型验证 | 第44-45页 |
4.7.3 与随机森林算法的对比 | 第45-47页 |
5 结论与展望 | 第47-50页 |
5.1 结论 | 第47-48页 |
5.2 展望 | 第48-50页 |
参考文献 | 第50-53页 |
致谢 | 第53-54页 |