小样本低质量数据下贷款需求分类模型研究
| 摘要 | 第4-5页 |
| Abstract | 第5页 |
| 第1章 引言 | 第8-11页 |
| 1.1 背景 | 第8页 |
| 1.2 理论研究 | 第8-9页 |
| 1.3 一般数据分析流程 | 第9-11页 |
| 第2章 数据预处理 | 第11-19页 |
| 2.1 提取分析所需要的主要数据 | 第11-12页 |
| 2.1.1 分析数据来源 | 第11页 |
| 2.1.2 提取需要标注的数据 | 第11-12页 |
| 2.2 数据标注 | 第12-17页 |
| 2.2.1 数据整理合并 | 第12-14页 |
| 2.2.2 数据标注 | 第14-16页 |
| 2.2.3 各数据来源标注处理 | 第16-17页 |
| 2.3 关联工商数据以及数据清洗 | 第17-19页 |
| 2.3.1 关联数据库工商数据 | 第17页 |
| 2.3.2 数据清洗以及信息提取 | 第17-19页 |
| 第3章 探索性数据研究 | 第19-27页 |
| 3.1 字段分析 | 第19页 |
| 3.2 探索性数据研究的有效性 | 第19-21页 |
| 3.3 探索性数据分析思路 | 第21页 |
| 3.4 主要的特征分析结果 | 第21-25页 |
| 3.4.1 公司类型 | 第22-23页 |
| 3.4.2 公司注册地级别 | 第23页 |
| 3.4.3 股东数量 | 第23-25页 |
| 3.4.4 公司成立时间 | 第25页 |
| 3.4.5 地区因素及其他特征简要分析 | 第25页 |
| 3.5 数据可视化注意问题 | 第25-27页 |
| 第4章 模型建立 | 第27-36页 |
| 4.1 理论基础 | 第27-31页 |
| 4.1.1 逻辑回归 | 第27-30页 |
| 4.1.2 模型聚合 | 第30-31页 |
| 4.2 建立算法模型 | 第31-34页 |
| 4.2.1 建模前的思考 | 第31-32页 |
| 4.2.2 建立模型 | 第32-34页 |
| 4.3 模型评价 | 第34-36页 |
| 第5章 总结与展望 | 第36-37页 |
| 参考文献 | 第37-41页 |
| 致谢 | 第41页 |