高维稀疏离群数据集延伸知识发现研究
摘要 | 第3-5页 |
ABSTRACT | 第5-7页 |
1 绪论 | 第13-21页 |
1.1 研究背景 | 第13-14页 |
1.2 国内外研究现状 | 第14-16页 |
1.3 研究目的 | 第16-17页 |
1.4 主要研究内容 | 第17-19页 |
1.5 论文的组织 | 第19-21页 |
2 相关概念与技术 | 第21-31页 |
2.1 数据挖掘概述 | 第21-24页 |
2.1.1 数据挖掘功能 | 第21-22页 |
2.1.2 数据挖掘分类 | 第22-23页 |
2.1.3 数据挖掘过程 | 第23-24页 |
2.2 数据预处理 | 第24-27页 |
2.2.1 原始数据特性 | 第24-25页 |
2.2.2 数据预处理方法 | 第25-27页 |
2.3 数据分类与聚类 | 第27-29页 |
2.3.1 数据分类方法 | 第27页 |
2.3.2 数据聚类方法 | 第27-29页 |
2.4 小结 | 第29-31页 |
3 离群挖掘与分析 | 第31-51页 |
3.1 离群挖掘技术 | 第31-33页 |
3.1.1 离群数据定义 | 第31页 |
3.1.2 离群数据对算法的影响 | 第31-32页 |
3.1.3 离群挖掘方法分类 | 第32-33页 |
3.2 基于距离的离群挖掘 | 第33-38页 |
3.2.1 k-NNOM 算法 | 第33-34页 |
3.2.2 一种基于分区的算法 | 第34-38页 |
3.3 基于密度的离群挖掘 | 第38-39页 |
3.4 基于统计的离群分析技术 | 第39-46页 |
3.4.1 探索性离群分析 | 第39页 |
3.4.2 一元离群分析 | 第39-43页 |
3.4.3 多维离群分析 | 第43-46页 |
3.5 基于常规挖掘算法的离群检测 | 第46-50页 |
3.5.1 基于聚类的技术 | 第46-47页 |
3.5.2 基于不平衡分类的离群检测 | 第47-49页 |
3.5.3 基于非频繁模式的离群检测 | 第49-50页 |
3.6 小结 | 第50-51页 |
4 离群约简及其搜索算法 | 第51-67页 |
4.1 粗糙集基本理论 | 第51-55页 |
4.1.1 基本概念 | 第51-52页 |
4.1.2 属性重要度 | 第52-53页 |
4.1.3 属性约简 | 第53-55页 |
4.2 离群划分与离群约简 | 第55-59页 |
4.2.1 基本思想 | 第55页 |
4.2.2 离群划分与离群约简的定义 | 第55-56页 |
4.2.3 α-离群约简 | 第56-58页 |
4.2.4 属性离群贡献度 | 第58-59页 |
4.3 基于遗传算法的Α-离群约简算法ΑGORA | 第59-66页 |
4.3.1 遗传算法基本思想 | 第59-60页 |
4.3.2 编码与初始种群生成 | 第60页 |
4.3.3 适应度函数设计 | 第60-61页 |
4.3.4 遗传算子设计 | 第61-63页 |
4.3.5 αGORA 算法描述与分析 | 第63-64页 |
4.3.6 实验结果与讨论 | 第64-66页 |
4.4 小结 | 第66-67页 |
5 关键域子空间及其搜索算法 | 第67-83页 |
5.1 关键域子空间KAS | 第67-71页 |
5.1.1 显著域子空间 | 第67-68页 |
5.1.2 关键域子空间 | 第68-70页 |
5.1.3 离群对象分类 | 第70-71页 |
5.2 单个离群对象的KAS 搜索算法 | 第71-75页 |
5.2.1 基于统计的搜索算法SK15 | 第72页 |
5.2.2 基于显著性子空间的搜索算法MK15 | 第72-74页 |
5.2.3 算法分析与比较 | 第74-75页 |
5.3 离群集的KAS 搜索算法 | 第75-83页 |
5.3.1 离群包络与离群核 | 第75页 |
5.3.2 基于离群核的搜索算法OCKS | 第75-77页 |
5.3.3 基于离群属性频度的搜索算法OFKS | 第77-78页 |
5.3.4 基于统计测试的搜索算法STKS | 第78-80页 |
5.3.5 算法分析与比较 | 第80-83页 |
6 离群集中的知识发现 | 第83-101页 |
6.1 离群对象特性 | 第83-84页 |
6.2 离群数据聚类 | 第84-88页 |
6.2.1 离群聚类的意义 | 第84页 |
6.2.2 离群共享属性相似度 | 第84-86页 |
6.2.3 离群聚类问题与原则 | 第86-88页 |
6.3 离群聚类算法 | 第88-98页 |
6.3.1 基于KAS 的离群聚类算法KOCA | 第88-91页 |
6.3.2 基于邻接图的离群聚类算法AGOC | 第91-94页 |
6.3.3 实验结果与讨论 | 第94-98页 |
6.4 基于离群K-最近邻的离群数据分析 | 第98-99页 |
6.4.1 离群K-最近邻的定义 | 第98页 |
6.4.2 离群K-最近邻与离群簇 | 第98-99页 |
6.5 关键域子空间分析 | 第99-100页 |
6.6 小结 | 第100-101页 |
7 序列数据离群处理与分析 | 第101-115页 |
7.1 序列离群检测 | 第101-102页 |
7.1.1 序列离群模式分类 | 第101-102页 |
7.1.2 序列离群检测技术 | 第102页 |
7.2 缺失值处理方法 | 第102-104页 |
7.2.1 缺失值处理概述 | 第102-103页 |
7.2.2 ROUSTIDA 算法 | 第103-104页 |
7.3 灰插值推理方法GIRA | 第104-111页 |
7.3.1 灰预测模型GM(1,1) | 第105页 |
7.3.2 灰插值模型 | 第105-107页 |
7.3.3 插值组合系统优化 | 第107-108页 |
7.3.4 GIRA 算法描述 | 第108-109页 |
7.3.5 GIRA 适应性分析 | 第109页 |
7.3.6 算例分析 | 第109-111页 |
7.4 离群趋势分析 | 第111-113页 |
7.4.1 离群对象分析 | 第111-113页 |
7.4.2 离群属性分析 | 第113页 |
7.5 小结 | 第113-115页 |
8 总结 | 第115-119页 |
8.1 主要贡献与特色 | 第115-116页 |
8.2 需要进一步研究的问题 | 第116-119页 |
致谢 | 第119-121页 |
参考文献 | 第121-129页 |
附录 | 第129-130页 |