摘要 | 第4-6页 |
ABSTRACT | 第6-7页 |
1 绪论 | 第10-16页 |
1.1 研究背景及意义 | 第10-11页 |
1.2 国内外研究现状 | 第11-13页 |
1.3 主要研究内容 | 第13页 |
1.4 论文结构安排 | 第13-16页 |
2 相关工作 | 第16-40页 |
2.1 属性选择算法 | 第16-21页 |
2.1.1 Information Gain信息增益算法 | 第16-17页 |
2.1.2 Chi Square卡方分布算法 | 第17页 |
2.1.3 基于Fisher Score的属性选择算法 | 第17-18页 |
2.1.4 Gini Index基于基尼系数的属性选择算法 | 第18页 |
2.1.5 SBMLR基于稀疏多项式逻辑回归的属性选择算法 | 第18页 |
2.1.6 T-test基于T检验的属性选择算法 | 第18-19页 |
2.1.7 RankSearch | 第19页 |
2.1.8 LinearForwardSelection线性向前选择算法 | 第19-20页 |
2.1.9 MRF | 第20-21页 |
2.1.10 SFS顺序向前选择 | 第21页 |
2.2 数据选择算法 | 第21-24页 |
2.2.1 RUS | 第21页 |
2.2.2 CNN | 第21-22页 |
2.2.3 SMOTE | 第22-23页 |
2.2.4 ADASYN | 第23-24页 |
2.2.5 OSS | 第24页 |
2.3 多类不均衡分类算法 | 第24-37页 |
2.3.1 从二元分类到多类分类:相关分解方法 | 第24-26页 |
2.3.2 Multi-IM | 第26页 |
2.3.3 ImECOC | 第26-28页 |
2.3.4 Diversified One-against-One (DOVO) | 第28-30页 |
2.3.5 从二元决策树HDDT到多元决策树MC-HDDT | 第30-31页 |
2.3.6 改进的AdaBoost算法 | 第31-37页 |
2.4 衡量不均衡数据分类的常用方法 | 第37-38页 |
2.5 本章小结 | 第38-40页 |
3 属性选择算法和数据选择算法对二元不均衡数据分类的影响 | 第40-60页 |
3.1 问题定义 | 第40页 |
3.2 实验内容 | 第40-41页 |
3.3 实验数据 | 第41-42页 |
3.4 结果分析 | 第42-57页 |
3.4.1 our-结合多种属性选择方法 | 第42-43页 |
3.4.2 分类算法C4.5 的结果分析 | 第43-53页 |
3.4.3 分类算法C4.5CS的结果分析 | 第53-54页 |
3.4.4 分类算法LibSVM的结果分析 | 第54-55页 |
3.4.5 综合结果分析 | 第55-57页 |
3.5 本章小结 | 第57-60页 |
4 多类不均衡数据分类算法性能的大规模实验对比分析 | 第60-72页 |
4.1 问题定义 | 第60页 |
4.2 数据描述 | 第60-61页 |
4.3 实验结果 | 第61页 |
4.4 实验结果分析 | 第61-64页 |
4.5 新的多类不均衡数据分类方法DECOC | 第64-70页 |
4.6 本章小结 | 第70-72页 |
5 总结与展望 | 第72-74页 |
参考文献 | 第74-80页 |
附录A 缩写名词对照表 | 第80-82页 |
附录B 属性选择算法和数据选择算法对分类影响的实验结果 | 第82-94页 |
附录C 多类不均衡数据分类结果 | 第94-98页 |
致谢 | 第98-100页 |
攻读学位期间的科研成果 | 第100-101页 |