| 摘要 | 第1-6页 |
| ABSTRACT | 第6-9页 |
| 第1章 绪论 | 第9-31页 |
| ·引言 | 第9-10页 |
| ·非平衡数据及其分类问题 | 第10-26页 |
| ·为什么稀少性使数据挖掘变得困难 | 第10-16页 |
| ·解决稀少性的方法 | 第16-26页 |
| ·传统的特征选择度量 | 第26-29页 |
| ·本文结构和创新点 | 第29-31页 |
| 第2章 非平衡数据学习方法综述 | 第31-53页 |
| ·非平衡数据的评价标准 | 第31-35页 |
| ·列联表和分类准确率 | 第31-32页 |
| ·ROC曲线 | 第32-33页 |
| ·AUC值 | 第33页 |
| ·F-值和几何平均 | 第33-34页 |
| ·Lift表和Lift曲线 | 第34-35页 |
| ·重抽样和欠抽样 | 第35-45页 |
| ·欠抽样 | 第36-41页 |
| ·重抽样 | 第41-45页 |
| ·训练集合划分方法 | 第45-48页 |
| ·分类器集成 | 第48-50页 |
| ·代价敏感度学习 | 第50-53页 |
| 第3章 非平衡数据的特征选择方法 | 第53-75页 |
| ·特征选择中的度量 | 第53-56页 |
| ·Case-Specific-IG算法 | 第56-58页 |
| ·RELIEF算法 | 第58-59页 |
| ·FAST算法 | 第59-61页 |
| ·特征选择方法框架 | 第61-63页 |
| ·实证模拟 | 第63-75页 |
| ·数据集合 | 第63页 |
| ·评估指标 | 第63-64页 |
| ·试验结果 | 第64-75页 |
| 第4章 基于类型分解和Hellinger距离的特征选择 | 第75-89页 |
| ·传统特征选择所面临的问题 | 第75-77页 |
| ·基于类型分解的特征选择方法 | 第77-78页 |
| ·基于Hellinger距离的特征选择方法 | 第78-80页 |
| ·实证分析 | 第80-89页 |
| ·数据集合描述 | 第80-81页 |
| ·类型分解方法实证结果 | 第81-85页 |
| ·Hellinger距离的特征选择方法 | 第85-89页 |
| 第5章 结束语 | 第89-91页 |
| 参考文献 | 第91-97页 |
| 致谢 | 第97-98页 |
| 在读期间发表的学术论文与取得的其他研究成果 | 第98页 |