基于代价敏感的决策树的电信离网分析模型的研究
摘要 | 第1-5页 |
Abstract | 第5-8页 |
第一章 绪论 | 第8-13页 |
·研究背景 | 第8-9页 |
·国内外研究现状及问题的提出 | 第9-11页 |
·本文的研究内容 | 第11-13页 |
第二章 电信数据仓库构建概述 | 第13-20页 |
·数据仓库概述 | 第13-14页 |
·电信数据仓库的体系结构 | 第14-15页 |
·面向客户流失分析的数据模型 | 第15页 |
·PAS客户流失的实体关系 | 第15-16页 |
·PAS客户流失分析数据仓库模型 | 第16-20页 |
第三章 数据准备 | 第20-28页 |
·PAS客户数据的特征 | 第20-21页 |
·噪音清除与空缺补全 | 第21-23页 |
·PAS用户数据的噪音清除 | 第22页 |
·PAS用户数据的空缺补全 | 第22-23页 |
·属性筛选与抽取 | 第23页 |
·高度分支的属性 | 第23页 |
·新属性的抽取: | 第23页 |
·连续数据离散化 | 第23-27页 |
·常用离散方法 | 第24-25页 |
·PAS用户数据离散化 | 第25-27页 |
·数据宽表 | 第27-28页 |
第四章 传统决策树算法 | 第28-34页 |
·分类算法概述 | 第28页 |
·决策树 | 第28-30页 |
·建树阶段 | 第29页 |
·剪枝阶段 | 第29-30页 |
·C4.5算法简介 | 第30-33页 |
·有关概念的描述和公式定义 | 第31页 |
·建树策略 | 第31-32页 |
·基于熵的离散策略 | 第32页 |
·对缺失值的处理 | 第32-33页 |
·修剪策略 | 第33页 |
·本章小结 | 第33-34页 |
第五章 基于代价敏感的决策树 | 第34-46页 |
·引入代价敏感的必要性 | 第34-35页 |
·误分类代价定义 | 第35-36页 |
·代价矩阵 | 第35-36页 |
·代价的量化描述 | 第36页 |
·误分类代价敏感化 | 第36-43页 |
·基于误分代价的样本分布调整方法 | 第37-38页 |
·基于调整初始权重的误分代价敏感化方法 | 第38-41页 |
·基于误分代价的建树学习方法 | 第41-43页 |
·测试代价 | 第43-44页 |
·CS_DT中的测试代价 | 第43-44页 |
·ReDist方法和C4.5_cs中的测试代价 | 第44页 |
·本章小结 | 第44-46页 |
第六章 建立基于代价敏感的决策树模型 | 第46-53页 |
·模型评估方法 | 第46-49页 |
·实验结果 | 第49-53页 |
总结与展望 | 第53-54页 |
致谢 | 第54-55页 |
参考文献 | 第55-58页 |
附录A(攻读硕士学位期间发表的论文) | 第58页 |