摘要 | 第2-4页 |
ABSTRACT | 第4-6页 |
第一章 绪论 | 第10-24页 |
第一节 研究背景及意义 | 第10-12页 |
一、研究背景 | 第10-11页 |
二、研究意义 | 第11-12页 |
第二节 文献综述 | 第12-18页 |
一、国内外研究现状 | 第12-18页 |
二、现有研究述评 | 第18页 |
第三节 研究内容及研究难点 | 第18-22页 |
一、研究思路 | 第18-19页 |
二、研究内容与基本框架 | 第19-22页 |
三、研究难点及其解决方法 | 第22页 |
第四节 创新点 | 第22-24页 |
一、电信业客户流失预测研究视角的创新 | 第22-23页 |
二、电信业客户流失预测指标体系的创新 | 第23页 |
三、Stacking集成学习算法的引入 | 第23-24页 |
第二章 电信业客户流失预测相关理论与方法阐述 | 第24-37页 |
第一节 电信业客户流失相关概念界定 | 第24-28页 |
一、流失客户定义 | 第24-25页 |
二、低流量客户与中高流量客户 | 第25-28页 |
第二节 自编码方法概述 | 第28-30页 |
一、自编码算法原理 | 第28页 |
二、自编码算法实现 | 第28-30页 |
第三节 预测方法概述 | 第30-37页 |
一、逻辑回归算法 | 第30-31页 |
二、随机森林算法 | 第31-32页 |
三、XGBoost算法 | 第32-35页 |
四、Stacking集成学习算法 | 第35-37页 |
第三章 浙江移动公司客户数据采集与预处理 | 第37-51页 |
第一节 数据采集 | 第37-44页 |
一、数据来源 | 第37-38页 |
二、时间窗口的确定及数据抽取 | 第38-39页 |
三、预选指标体系的设计 | 第39-44页 |
第二节 数据预处理 | 第44-51页 |
一、数据清洗 | 第44-46页 |
二、相关性检验 | 第46-51页 |
第四章 浙江移动公司低流量客户流失预测 | 第51-69页 |
第一节 低流量客户流失特征分析 | 第51-57页 |
一、基础属性与流失关系分析 | 第51-52页 |
二、通信特征与流失关系分析 | 第52-54页 |
三、流量特征与流失关系分析 | 第54-57页 |
第二节 低流量客户流失预测指标体系的确立 | 第57-59页 |
一、IV值简介 | 第57-58页 |
二、指标体系确立 | 第58-59页 |
第三节 自编码降维 | 第59-62页 |
一、数据转换 | 第59-60页 |
二、基于自编码器降维 | 第60-62页 |
第四节 低流量客户流失预测模型训练与评价 | 第62-69页 |
一、模型评价标准 | 第62-63页 |
二、单一模型训练与评价 | 第63-65页 |
三、Stacking集成模型训练与评价 | 第65-69页 |
第五章 浙江移动公司中高流量客户流失预测 | 第69-82页 |
第一节 中高流量客户流失特征分析 | 第69-74页 |
一、基础属性与流失关系分析 | 第69-70页 |
二、通信特征与流失关系分析 | 第70-72页 |
三、流量特征与流失关系分析 | 第72-74页 |
第二节 中高流量客户流失预测指标体系的确立 | 第74-76页 |
一、指标体系确立 | 第74-76页 |
二、指标体系对比 | 第76页 |
第三节 自编码降维 | 第76-78页 |
一、数据转换 | 第76-77页 |
二、基于自编码器降维 | 第77-78页 |
第四节 中高流量客户流失预测模型训练与评价 | 第78-82页 |
一、单一模型训练与评价 | 第78-80页 |
二、Stacking集成模型训练与评价 | 第80-82页 |
第六章 结论与展望 | 第82-84页 |
第一节 结论 | 第82-83页 |
一、基于流量对客户进行分层建模有助于提升变量显著性 | 第82页 |
二、采用IV值结合自编码方法降维有助于提高模型运行效率 | 第82页 |
三、基于Stacking集成的方式预测效果较好 | 第82-83页 |
第二节 展望 | 第83-84页 |
参考文献 | 第84-88页 |
附录 核心建模代码 | 第88-93页 |
致谢 | 第93-94页 |