基于不平衡数据的支持向量机和决策树算法的研究
| 摘要 | 第3-4页 |
| Abstract | 第4页 |
| 1 绪论 | 第7-14页 |
| 1.1 不均衡样本学习的背景 | 第7-8页 |
| 1.2 不平衡数据的处理方法 | 第8-10页 |
| 1.2.1 算法层面的处理方法 | 第8-9页 |
| 1.2.2 样本层面的处理方法 | 第9-10页 |
| 1.2.3 算法和样本相结合的方法 | 第10页 |
| 1.3 评估标准 | 第10-12页 |
| 1.4 本文的写作动机和思路 | 第12-14页 |
| 2 研究方法 | 第14-30页 |
| 2.0 支持向量机的理论基础 | 第14-18页 |
| 2.0.1 线性可分的支持向量分类问题 | 第14-17页 |
| 2.0.2 线性不可分的支持向量分类问题 | 第17-18页 |
| 2.1 SMOTE-SVM模型 | 第18-19页 |
| 2.1.1 SMOTE抽样技术介绍 | 第18-19页 |
| 2.2 CBO-SVM模型 | 第19-22页 |
| 2.2.1 背景介绍 | 第19-20页 |
| 2.2.2 两步聚类算法 | 第20-22页 |
| 2.2.3 CBO-SVM算法流程 | 第22页 |
| 2.3 RU-SMOTE-SVM模型 | 第22-23页 |
| 2.4 SMOTEBoosting-SVM模型 | 第23-25页 |
| 2.4.1 Boosting算法 | 第23-24页 |
| 2.4.2 SMOTEBoosting模型介绍 | 第24页 |
| 2.4.3 SMOTEBoosting的基本思想 | 第24-25页 |
| 2.5 C5.0决策树算法 | 第25-30页 |
| 2.5.1 决策树的研究背景 | 第25页 |
| 2.5.2 C5.0决策树的理论基础 | 第25-27页 |
| 2.5.3 C5.0决策树的生长算法 | 第27-28页 |
| 2.5.4 C5.0决策树的修剪方法 | 第28-30页 |
| 3 实证分析 | 第30-39页 |
| 3.1 数据来源与统计分析 | 第30-33页 |
| 3.2 实证结果 | 第33-37页 |
| 3.3 模型比较 | 第37-39页 |
| 结论 | 第39-40页 |
| 参考文献 | 第40-45页 |
| 致谢 | 第45-46页 |