商业银行客户的流失预警分析
摘要 | 第3-4页 |
ABSTRACT | 第4页 |
1 绪论 | 第7-10页 |
1.1 研究背景 | 第7页 |
1.2 国内外相关研究现况和发展趋向 | 第7-8页 |
1.3 本文的研究意义 | 第8页 |
1.4 本文的结构 | 第8-10页 |
2 数据挖掘技术实施流程概述与思考 | 第10-20页 |
2.1 数据挖掘流程介绍 | 第10-12页 |
2.2 建立并理解数据集 | 第12-15页 |
2.2.1 数据收集 | 第12-13页 |
2.2.2 数据描述 | 第13-14页 |
2.2.3 数据选择 | 第14页 |
2.2.4 数据质量评估和数据清理 | 第14页 |
2.2.5 合并与整合 | 第14-15页 |
2.2.6 构建元数据加载并维护数据挖掘库 | 第15页 |
2.3 建模所需的数据准备 | 第15-16页 |
2.3.1 选择变量 | 第15-16页 |
2.3.2 选择记录 | 第16页 |
2.3.3 创建新变量 | 第16页 |
2.3.4 转换变量 | 第16页 |
2.4 建立模型 | 第16-17页 |
2.5 模型的评价和解释 | 第17-19页 |
2.5.1 内部评价 | 第17-18页 |
2.5.2 外部评价 | 第18页 |
2.5.3 模型解释 | 第18-19页 |
2.6 模型的实施 | 第19-20页 |
3 商业银行流失预警模型的建立 | 第20-47页 |
3.1 问题描述 | 第20页 |
3.2 业务数据理解及其变量选择 | 第20-25页 |
3.2.1 目标客户群的选择 | 第20-21页 |
3.2.2 模型变量的选择 | 第21-25页 |
3.3 预测变量与目标变量的相关性检验 | 第25-33页 |
3.3.1 分类变量的直方图检验 | 第26-30页 |
3.3.2 分类变量的卡方检验 | 第30-31页 |
3.3.3 连续变量的相关性检验 | 第31-33页 |
3.4 预测变量之间的相关性检验 | 第33-37页 |
3.4.1 变量之间的相关性检验 | 第33-37页 |
3.4.2 模型多重共线性的检测 | 第37页 |
3.5 模型的选择 | 第37-39页 |
3.5.1 Logistic 回归 | 第37-38页 |
3.5.2 主成分分析 | 第38-39页 |
3.6 建立模型 | 第39-46页 |
3.6.1 主成分分析 | 第39-44页 |
3.6.2 逻辑回归 | 第44-46页 |
3.7 模型的假设检验 | 第46-47页 |
3.7.1 模型的显著性检验 | 第46页 |
3.7.2 单个变量的显著性检验 | 第46-47页 |
4 模型的综合评价 | 第47-52页 |
4.1 准确率评估 | 第47页 |
4.2 模型的累积提升度 | 第47-49页 |
4.3 模型的累积捕获响应百分比 | 第49-50页 |
4.4 综合评价 | 第50-52页 |
5 总结 | 第52-53页 |
致谢 | 第53-54页 |
参考文献 | 第54-56页 |
附录 | 第56-61页 |
附录A:数值型字符型变量填充确失值 | 第56-58页 |
附录B:数值型自变量的首次筛选 | 第58-61页 |