基于混合采样的非平衡数据集分类研究

摘要	第3-4页
ABSTRACT	第4-5页
1 绪论	第8-11页
1.1 课题研究背景及意义	第8-9页
1.2 本文主要研究内容及创新点	第9页
1.3 本文的组织结构	第9-11页
2 非平衡数据集分类的研究综述	第11-22页
2.1 非平衡数据集分类的难点	第11-13页
2.2 非平衡数据集分类的相关研究	第13-18页
2.2.1 算法层面的方法	第13-16页
2.2.2 数据层面的方法	第16-18页
2.3 非平衡数据集分类的评价标准	第18-21页
2.3.1 g-mean 准则	第19-20页
2.3.2 F-value 准则	第20页
2.3.3 ROC 曲线及 AUC 面积	第20-21页
2.4 本章小结	第21-22页
3 支持向量机和非平衡数据集学习	第22-30页
3.1 支持向量机分析	第22-26页
3.1.1 支持向量机	第22-24页
3.1.2 数据不均衡性对支持向量机的影响	第24-26页
3.2 非平衡数据集学习	第26-29页
3.2.1 SMOTE 算法	第26-27页
3.2.2 SMOTE 算法的不足之处	第27-29页
3.3 本章小结	第29-30页
4 基于混合采样的非平衡数据集分类模型设计	第30-42页
4.1 三种性质样本点定义	第30-33页
4.2 噪声点样本的处理	第33页
4.3 安全点样本的处理	第33-34页
4.4 危险点样本的处理	第34-38页
4.4.1 边界区域切割方法	第35-37页
4.4.2 边界区域切割方法与简单随机欠采样方法比较	第37-38页
4.5 SVM-IMSA 算法	第38-41页
4.5.1 SVM-IMSA 算法描述	第38-39页
4.5.2 SVM-IMSA 算法伪代码	第39-40页
4.5.3 SVM-IMSA 算法性能分析	第40-41页
4.6 本章小结	第41-42页
5 实验及结果分析	第42-50页
5.1 实验数据集	第42-43页
5.2 对比算法简单介绍	第43-44页
5.3 实验结果及性能分析	第44-49页
5.3.1 参数和对算法性能的影响	第44-45页
5.3.2 本文算法采样样本集对比	第45-46页
5.3.3 不同算法在非平衡数据集上的性能比较	第46-48页
5.3.4 不同比例程度下算法性能比较	第48-49页
5.4 本章小结	第49-50页
6 总结及展望	第50-52页
6.1 总结	第50页
6.2 进一步工作	第50-52页
致谢	第52-53页
参考文献	第53-56页
附录	第56页