摘要 | 第4-6页 |
Abstarct | 第6-8页 |
Chapter 1 Introduction | 第11-20页 |
1.1 Background | 第11-12页 |
1.2 Literature review | 第12-18页 |
1.2.1 Researches on metrics | 第13-14页 |
1.2.2 Researches on models | 第14-15页 |
1.2.3 Researches on the class imbalance issue | 第15-17页 |
1.2.4 Problem need to be further researched | 第17-18页 |
1.3 Main content | 第18-20页 |
Chapter 2 System Design | 第20-29页 |
2.1 Research questions | 第20-21页 |
2.2 System architecture | 第21-24页 |
2.3 Evaluation measures | 第24-28页 |
2.4 Conclusion | 第28-29页 |
Chapter 3 Empirical study on effectiveness of Classifier | 第29-47页 |
3.1 Introduction | 第29-31页 |
3.2 Importance of classifier | 第31页 |
3.3 Naive bayes | 第31-32页 |
3.4 K-nearest neighbour method | 第32-33页 |
3.5 Decision tree | 第33-35页 |
3.6 Random forest | 第35-37页 |
3.7 Support vector machine | 第37-39页 |
3.8 Function SMO | 第39-40页 |
3.9 Bagging and Ada Boost M1 | 第40-41页 |
3.10 Logistic regression | 第41-43页 |
3.11 Experiments | 第43-45页 |
3.12 Conclusion | 第45-47页 |
Chapter 4 Empirical study on Data Preprocessing | 第47-65页 |
4.1 Introduction | 第47-48页 |
4.2 Motivation | 第48-49页 |
4.3 Techniques | 第49-53页 |
4.3.1 Selected PCA | 第49-50页 |
4.3.2 Propositionalization | 第50-52页 |
4.3.3 Feature selection | 第52-53页 |
4.4 Aggregation | 第53-54页 |
4.5 Sampling | 第54-56页 |
4.6 Dimensionality reduction | 第56-57页 |
4.7 Feature subset selection | 第57-58页 |
4.8 Experiments | 第58-64页 |
4.9 Conclusion | 第64-65页 |
Chapter 5 SMOTE and its Improvement | 第65-87页 |
5.1 Introduction | 第65-67页 |
5.2 Algorithm of SMOTE | 第67-68页 |
5.3 SMOTE’s shortcoming | 第68-69页 |
5.4 Improvement on SMOTE | 第69-70页 |
5.4.1 Step 1 (Testing for data sparsity) | 第69页 |
5.4.2 Step 2 (Clustering for minority class) | 第69-70页 |
5.4.3 Step 3 (Use 2 class sample generalization) | 第70页 |
5.5 Experiments on SMOTE | 第70-82页 |
5.6 Experiments on ASMO | 第82-85页 |
5.7 Comparison between SMOTE and ASMO | 第85-86页 |
5.8 Conclusion | 第86-87页 |
Conclusion | 第87-89页 |
References | 第89-99页 |
Acknowledgements | 第99页 |