摘要 | 第1-6页 |
ABSTRACT | 第6-9页 |
第1章 绪论 | 第9-31页 |
·引言 | 第9-10页 |
·非平衡数据及其分类问题 | 第10-26页 |
·为什么稀少性使数据挖掘变得困难 | 第10-16页 |
·解决稀少性的方法 | 第16-26页 |
·传统的特征选择度量 | 第26-29页 |
·本文结构和创新点 | 第29-31页 |
第2章 非平衡数据学习方法综述 | 第31-53页 |
·非平衡数据的评价标准 | 第31-35页 |
·列联表和分类准确率 | 第31-32页 |
·ROC曲线 | 第32-33页 |
·AUC值 | 第33页 |
·F-值和几何平均 | 第33-34页 |
·Lift表和Lift曲线 | 第34-35页 |
·重抽样和欠抽样 | 第35-45页 |
·欠抽样 | 第36-41页 |
·重抽样 | 第41-45页 |
·训练集合划分方法 | 第45-48页 |
·分类器集成 | 第48-50页 |
·代价敏感度学习 | 第50-53页 |
第3章 非平衡数据的特征选择方法 | 第53-75页 |
·特征选择中的度量 | 第53-56页 |
·Case-Specific-IG算法 | 第56-58页 |
·RELIEF算法 | 第58-59页 |
·FAST算法 | 第59-61页 |
·特征选择方法框架 | 第61-63页 |
·实证模拟 | 第63-75页 |
·数据集合 | 第63页 |
·评估指标 | 第63-64页 |
·试验结果 | 第64-75页 |
第4章 基于类型分解和Hellinger距离的特征选择 | 第75-89页 |
·传统特征选择所面临的问题 | 第75-77页 |
·基于类型分解的特征选择方法 | 第77-78页 |
·基于Hellinger距离的特征选择方法 | 第78-80页 |
·实证分析 | 第80-89页 |
·数据集合描述 | 第80-81页 |
·类型分解方法实证结果 | 第81-85页 |
·Hellinger距离的特征选择方法 | 第85-89页 |
第5章 结束语 | 第89-91页 |
参考文献 | 第91-97页 |
致谢 | 第97-98页 |
在读期间发表的学术论文与取得的其他研究成果 | 第98页 |