基于随机森林的电信客户流失预测应用研究

摘要	第5-6页
Abstract	第6页
第一章绪论	第9-13页
1.1 研究背景和意义	第9-10页
1.2 数据挖掘与电信客户流失的研究现状	第10-12页
1.3 研究内容安排与技术路线	第12-13页
第二章客户流失的相关理论与技术论述	第13-21页
2.1 数据挖掘的理论介绍	第13-15页
2.1.1 数据挖掘的概念	第13页
2.1.2 数据挖掘的过程	第13页
2.1.3 集成学习算法	第13-15页
2.2 电信客户流失的概述	第15-17页
2.2.1 客户流失的问题定义	第15-16页
2.2.2 客户流失面临的问题和挑战	第16-17页
2.3 不平衡分类问题的研究	第17-20页
2.3.1 不平衡分类问题的定义	第17页
2.3.2 基于数据层面的类平衡化的方法	第17-18页
2.3.3 基于算法层面的类平衡化方法	第18-19页
2.3.4 基于集成算法层面的类平衡化的方法	第19-20页
2.4 特征选择	第20页
2.5 本章总结	第20-21页
第三章装袋和随机森林预测模型的构建	第21-51页
3.1 数据准备与预处理	第21-28页
3.1.1 数据的介绍	第21-22页
3.1.2 数据预处理的方法和步骤	第22-28页
3.1.3 类不平衡数据的处理	第28页
3.2 特征选择方法	第28-30页
3.2.1 基于Fisher得分的特征选择方法	第29页
3.2.2 基于主成分分析的特征选择方法	第29-30页
3.3 决策树、装袋与随机森林模型	第30-35页
3.3.1 决策树模型	第30-32页
3.3.2 装袋	第32-33页
3.3.3 随机森林	第33-34页
3.3.4 交叉验证法	第34-35页
3.4 模型的评估指标	第35-39页
3.4.1 常用的评价指标	第35-36页
3.4.2 期望利润最大的评价指标	第36-39页
3.5 实验环境与实验设计	第39-40页
3.6 实验结果分析	第40-50页
3.6.1 特征个数对模型训练的影响	第41-45页
3.6.2 过采样方法的结果对比分析	第45-49页
3.6.3 使用期望利润最大评价方法对比结果	第49-50页
3.7 本章总结	第50-51页
第四章样本依赖的代价敏感性集成学习模型构建	第51-56页
4.1 样本依赖代价敏感的决策树模型	第51-53页
4.2 EDCS-RandomForest模型的构建	第53-54页
4.3 实验设计与分析	第54-55页
4.4 本章总结	第55-56页
第五章总结与展望	第56-58页
参考文献	第58-61页
攻读硕士学位期间取得的研究成果	第61-62页
致谢	第62-63页
附录	第63页