| ABSTRACT | 第1-5页 |
| 摘要 | 第5-14页 |
| Chapter 1 Introduction | 第14-17页 |
| ·Definition of the problem | 第14-15页 |
| ·Objective | 第15-16页 |
| ·Organization of this dissertation | 第16-17页 |
| Chapter 2 Imbalance Datasets:tackling the problem | 第17-29页 |
| ·Sampling Methods for Imbalance Datasets | 第17-18页 |
| ·Under-sampling | 第17页 |
| ·Over-sampling | 第17-18页 |
| ·Ensemble Meta-Learning Algorithms | 第18-21页 |
| ·Bagging | 第19-20页 |
| ·Adaboost | 第20-21页 |
| ·Cost Sensitive Algorithms | 第21-23页 |
| ·Adacost | 第21-23页 |
| ·CSB2 | 第23页 |
| ·Smote | 第23-27页 |
| ·Other Approaches | 第27-28页 |
| ·Conclusion | 第28-29页 |
| Chapter 3 E-AdSampling Algorithm | 第29-34页 |
| ·Generating Synthetic Examples | 第30-32页 |
| ·Sampling Training Datasets | 第32-33页 |
| ·Conclusion | 第33-34页 |
| Chapter 4 Evaluation | 第34-47页 |
| ·Measures use | 第34-35页 |
| ·The Receiver Operation Characteristic Curve | 第35-37页 |
| ·K-Fold Cross Validation | 第37-38页 |
| ·Datasets | 第38-40页 |
| ·Results and Discussion | 第40-42页 |
| ·The Receiver Operation Characteristic Curve for Each Dataset | 第42-46页 |
| ·Conclusion | 第46-47页 |
| Chapter 5 Conclusion | 第47-49页 |
| ·Future Work | 第48-49页 |
| Appendix A. Classifying with decision trees | 第49-52页 |
| Appendix B. Euclidean Distance | 第52-53页 |
| Appendix C. About WEKA | 第53-54页 |
| Appendix D. E-Adsampling Weka Integration | 第54-56页 |
| References | 第56-61页 |
| Acknowledgments | 第61-62页 |
| publications during the graduate period | 第62页 |