随机森林在电信行业客户流失预测中的应用
摘要 | 第1-5页 |
Abstract | 第5-11页 |
前言 | 第11-13页 |
第一章 电信行业客户流失预测 | 第13-17页 |
·选题的背景及意义 | 第13-14页 |
·电信行业客户流失预测研究的现状 | 第14-17页 |
第二章 分类问题和随机森林算法简介 | 第17-29页 |
·分类问题、分类器和分类器组合 | 第17-20页 |
·分类问题和分类器 | 第17-19页 |
·分类器组合 | 第19-20页 |
·决策树 | 第20-21页 |
·决策树方法简介 | 第20页 |
·分类回归树(CART) | 第20-21页 |
·Bagging方法 | 第21-22页 |
·随机森林 | 第22-29页 |
·随机森林的定义 | 第23页 |
·随机森林算法 | 第23-24页 |
·随机森林的泛化误差 | 第24-27页 |
·OOB估计 | 第27页 |
·随机森林的优点及其应用 | 第27-29页 |
第三章 利用随机森林建立流失预测初步模型 | 第29-46页 |
·随机森林的进一步研究 | 第29-36页 |
·流失与流失异常状态 | 第29-31页 |
·异常样本检测 | 第31-36页 |
·数据预处理 | 第36-41页 |
·数据描述 | 第36-39页 |
·删除数据集中的异常样本 | 第39-41页 |
·建立初步的流失预测模型 | 第41-46页 |
·RF对不平衡数据的处理方法 | 第41-43页 |
·RF模型参数的选择 | 第43页 |
·初步的流失预测模型 | 第43-46页 |
第四章 基于随机森林的改进流失预测模型 | 第46-67页 |
·基于随机森林坐标放缩的维归约 | 第46-56页 |
·维归约 | 第46-47页 |
·随机森林框架下的坐标放缩 | 第47-52页 |
·转导推理 | 第52-53页 |
·基于随机森林坐标放缩的维归约 | 第53-56页 |
·基于随机森林坐标放缩的超椭球 K均值改进算法 | 第56-62页 |
·改进的超椭球 K均值聚类算法 | 第57-59页 |
·仿真实验 | 第59-62页 |
·基于随机森林的改进流失预测模型 | 第62-63页 |
·模型预测结果的部分可解释性 | 第63-67页 |
第五章 总结与展望 | 第67-69页 |
参考文献 | 第69-71页 |
攻读硕士学位期间发表的论文 | 第71-72页 |
致谢 | 第72页 |