离群点检测方法研究及其在机器学习中的应用
摘要 | 第5-6页 |
abstract | 第6-7页 |
1 前言 | 第12-17页 |
1.1 研究背景及意义 | 第12页 |
1.2 离群点检测的发展历程 | 第12-14页 |
1.3 研究内容及思路 | 第14-15页 |
1.4 测试数据集 | 第15-17页 |
2 离群点检测技术 | 第17-30页 |
2.1 离群点检测技术概述 | 第17-22页 |
2.1.1 离群点产生原因 | 第19页 |
2.1.2 离群点的定义和分类 | 第19-20页 |
2.1.3 离群点检测应用 | 第20-22页 |
2.2 传统离群点检测算法概述 | 第22-29页 |
2.2.1 基于统计学的离群点检测算法 | 第22-23页 |
2.2.2 基于距离的离群点检测算法 | 第23-25页 |
2.2.3 基于密度的离群点检测算法 | 第25-28页 |
2.2.4 基于聚类的离群点检测算法 | 第28-29页 |
2.3 本章小结 | 第29-30页 |
3 数据处理与归约 | 第30-41页 |
3.1 变量敏感性分析 | 第30-36页 |
3.1.1 单变量分析 | 第30-32页 |
3.1.2 数据子空间 | 第32-36页 |
3.2 相关性分析 | 第36-38页 |
3.3 K-L正交转换 | 第38-40页 |
3.4 本章小结 | 第40-41页 |
4 基于频繁模式的离群点检测方法研究 | 第41-54页 |
4.1 传统离群点检测算法研究 | 第41-44页 |
4.1.1 基于全局离群点的检测 | 第41-43页 |
4.1.2 对集体离群点的探究 | 第43-44页 |
4.1.3 基于情境离群点的检测 | 第44页 |
4.2 频繁模式基本方法 | 第44-51页 |
4.2.1 基本概念 | 第45页 |
4.2.2 提取方法 | 第45-51页 |
4.3 基于频繁模式的离群点检测方法 | 第51-52页 |
4.3.1 方法的提出 | 第51-52页 |
4.3.2 应用效果分析 | 第52页 |
4.4 本章小结 | 第52-54页 |
5 离群点检测在机器学习中的应用 | 第54-66页 |
5.1 传统机器学习算法 | 第54-59页 |
5.1.1 模糊C均值算法 | 第55-57页 |
5.1.2 k-NN算法 | 第57-58页 |
5.1.3 传统机器学习算法的缺陷与不足 | 第58-59页 |
5.2 离群点检测嵌入机器学习算法 | 第59-61页 |
5.3 改进的k-NN方法 | 第61-63页 |
5.4 改进的机器学习算法在岩性识别中的应用 | 第63-65页 |
5.5 本章小结 | 第65-66页 |
6 实例应用 | 第66-76页 |
6.1 工区概况 | 第66-67页 |
6.2 测井属性的提取和处理 | 第67-71页 |
6.3 基于频繁模式的离群算法效果分析 | 第71-72页 |
6.4 改进的机器学习算法效果分析 | 第72-74页 |
6.5 本章小结 | 第74-76页 |
7 结论与认识 | 第76-78页 |
致谢 | 第78-79页 |
参考文献 | 第79-86页 |
附录 | 第86页 |