不平衡学习中的重采样方法研究

摘要	第3-4页
Abstract	第4-5页
1 绪论	第8-14页
1.1 课题的研究背景	第8-11页
1.2 课题的研究意义	第11-12页
1.3 论文研究的主要内容	第12页
1.4 论文的组织结构	第12-14页
2 不平衡学习的相关研究	第14-26页
2.1 不平衡学习的本质	第14-15页
2.2 不平衡学习的主要方法	第15-18页
2.2.1 数据层面	第15-16页
2.2.2 算法层面	第16-17页
2.2.3 集成层面	第17-18页
2.3 不平衡学习的模型选择	第18-20页
2.3.1 分类误差与过拟合	第18页
2.3.2 评估方法	第18-20页
2.4 不平衡学习的评估指标	第20-25页
2.4.1 基于混淆矩阵的评估指标	第20-22页
2.4.2 ROC曲线以及AUC值	第22-23页
2.4.3 PR曲线	第23-24页
2.4.4 代价曲线	第24-25页
2.5 本章小结	第25-26页
3 基于最大最小距离的上采样方法	第26-36页
3.1 概述	第26页
3.2 其他相关技术	第26-29页
3.2.1 支持向量机	第26-29页
3.3 主要思想和算法步骤	第29-30页
3.3.1 主要思想	第29-30页
3.3.2 算法步骤	第30页
3.4 实验与分析	第30-36页
3.4.1 数据集及实验设置	第30-31页
3.4.2 实验结果及分析	第31-36页
4 基于高斯混合模型的下采样方法	第36-48页
4.1 概述	第36页
4.2 高斯混合模型	第36-38页
4.2.1 单高斯模型	第36页
4.2.2 高斯混合模型	第36-38页
4.3 其他相关技术	第38-40页
4.3.1 决策树与随机森林	第38-40页
4.4 主要思想与算法流程	第40-44页
4.4.1 主要思想	第40-41页
4.4.2 GUS算法	第41-42页
4.4.3 采样前后的数据分布比较	第42-44页
4.5 实验与分析	第44-48页
4.5.1 数据集及实验设置	第44-45页
4.5.2 实验结果与分析	第45-48页
5 基于双层聚类算法的下采样方法	第48-57页
5.1 概述	第48页
5.2 相关技术介绍	第48-50页
5.2.1 K-means算法	第48-49页
5.2.2 K-medoids算法	第49-50页
5.3 主要思想和算法步骤	第50-52页
5.3.1 主要思想	第50-51页
5.3.2 算法步骤	第51-52页
5.4 实验与分析	第52-56页
5.4.1 数据集及实验设置	第52页
5.4.2 实验结果及分析	第52-56页
5.5 本章小结	第56-57页
6 总结与展望	第57-59页
6.1 总结	第57页
6.2 工作展望	第57-59页
致谢	第59-60页
参考文献	第60-65页
附录	第65页