基于不平衡数据的支持向量机和决策树算法的研究
摘要 | 第3-4页 |
Abstract | 第4页 |
1 绪论 | 第7-14页 |
1.1 不均衡样本学习的背景 | 第7-8页 |
1.2 不平衡数据的处理方法 | 第8-10页 |
1.2.1 算法层面的处理方法 | 第8-9页 |
1.2.2 样本层面的处理方法 | 第9-10页 |
1.2.3 算法和样本相结合的方法 | 第10页 |
1.3 评估标准 | 第10-12页 |
1.4 本文的写作动机和思路 | 第12-14页 |
2 研究方法 | 第14-30页 |
2.0 支持向量机的理论基础 | 第14-18页 |
2.0.1 线性可分的支持向量分类问题 | 第14-17页 |
2.0.2 线性不可分的支持向量分类问题 | 第17-18页 |
2.1 SMOTE-SVM模型 | 第18-19页 |
2.1.1 SMOTE抽样技术介绍 | 第18-19页 |
2.2 CBO-SVM模型 | 第19-22页 |
2.2.1 背景介绍 | 第19-20页 |
2.2.2 两步聚类算法 | 第20-22页 |
2.2.3 CBO-SVM算法流程 | 第22页 |
2.3 RU-SMOTE-SVM模型 | 第22-23页 |
2.4 SMOTEBoosting-SVM模型 | 第23-25页 |
2.4.1 Boosting算法 | 第23-24页 |
2.4.2 SMOTEBoosting模型介绍 | 第24页 |
2.4.3 SMOTEBoosting的基本思想 | 第24-25页 |
2.5 C5.0决策树算法 | 第25-30页 |
2.5.1 决策树的研究背景 | 第25页 |
2.5.2 C5.0决策树的理论基础 | 第25-27页 |
2.5.3 C5.0决策树的生长算法 | 第27-28页 |
2.5.4 C5.0决策树的修剪方法 | 第28-30页 |
3 实证分析 | 第30-39页 |
3.1 数据来源与统计分析 | 第30-33页 |
3.2 实证结果 | 第33-37页 |
3.3 模型比较 | 第37-39页 |
结论 | 第39-40页 |
参考文献 | 第40-45页 |
致谢 | 第45-46页 |