摘要 | 第4-6页 |
Abstract | 第6-8页 |
第1章 绪论 | 第11-18页 |
1.1 论文研究背景及意义 | 第11-14页 |
1.1.1 研究背景 | 第11-13页 |
1.1.2 选题目的和意义 | 第13-14页 |
1.2 国内外研究现状 | 第14-16页 |
1.2.1 非均衡数据分类问题研究现状 | 第14-16页 |
1.2.2 ID匹配问题研究现状 | 第16页 |
1.3 本文的主要工作及结构安排 | 第16-18页 |
第2章 分类技术及其性能评估 | 第18-30页 |
2.1 机器学习及其研究现状 | 第18-19页 |
2.2 常用分类器介绍 | 第19-25页 |
2.2.1 分类的定义 | 第19页 |
2.2.2 分类器的设计 | 第19-20页 |
2.2.3 典型的分类算法 | 第20-25页 |
2.3 分类器性能评估方法 | 第25-27页 |
2.4 分类器性能评估指标 | 第27-30页 |
2.4.1 一般分类器性能评估指标 | 第27-28页 |
2.4.2 非均衡数据分类器性能评估指标 | 第28-30页 |
第3章 非均衡数据重取样算法 | 第30-35页 |
3.1 引言 | 第30页 |
3.2 简单重采样技术 | 第30-31页 |
3.3 高级重采样技术 | 第31-34页 |
3.4 分类算法改进技术 | 第34-35页 |
第4章 改进的重采样算法 | 第35-52页 |
4.1 改进SMOTE的过采样算法 | 第35-45页 |
4.1.1 SMOTE算法的不足 | 第35页 |
4.1.2 K近邻过采样算法 | 第35-37页 |
4.1.3 实验 | 第37-45页 |
4.2 基于密度的欠采样算法 | 第45-48页 |
4.2.1 算法的提出 | 第45-47页 |
4.2.2 实验 | 第47-48页 |
4.3 基于距离的混合重取样算法 | 第48-52页 |
4.3.1 算法的提出 | 第48-50页 |
4.3.2 实验 | 第50-52页 |
第5章 ID-Mapping项目中对非均衡数据的研究 | 第52-58页 |
5.1 ID-Mapping项目介绍 | 第52页 |
5.2 ID-Mapping项目实现 | 第52-55页 |
5.3 算法在项目上的应用 | 第55-58页 |
第6章 总结和展望 | 第58-60页 |
6.1 本文总结 | 第58页 |
6.2 研究展望 | 第58-60页 |
参考文献 | 第60-63页 |
作者简介及在学期间科研成果 | 第63-64页 |
致谢 | 第64页 |