不确定数据的聚类分析与异常点检测算法
中文摘要 | 第5-7页 |
ABSTRACT | 第7-8页 |
第1章 绪论 | 第12-32页 |
1.1 研究背景及意义 | 第12-16页 |
1.1.1 不确定数据的产生原因 | 第12-13页 |
1.1.2 不确定数据模型 | 第13-16页 |
1.2 面向不确定数据的分析处理技术面临的挑战 | 第16-17页 |
1.3 相关工作 | 第17-29页 |
1.3.1 确定数据聚类 | 第18-23页 |
1.3.2 不确定数据聚类 | 第23-25页 |
1.3.3 异常点检测 | 第25-28页 |
1.3.4 数据流异常点检测 | 第28-29页 |
1.4 本文的主要贡献 | 第29-30页 |
1.5 本文的组织结构 | 第30-32页 |
第2章 障碍空间中不确定数据聚类算法 | 第32-44页 |
2.1 引言 | 第32-33页 |
2.2 问题定义 | 第33-34页 |
2.3 OBS-UK-Means算法描述 | 第34-35页 |
2.4 剪枝算法 | 第35-39页 |
2.4.1 基于R树的剪枝算法 | 第35-37页 |
2.4.2 基于Voronoi图的剪枝算法 | 第37-38页 |
2.4.3 最短距离区域 | 第38-39页 |
2.5 性能分析 | 第39-43页 |
2.5.1 数据集 | 第41页 |
2.5.2 效率测试 | 第41-42页 |
2.5.3 有效性测试 | 第42-43页 |
2.5.4 聚类质量 | 第43页 |
2.6 本章小结 | 第43-44页 |
第3章 不确定数据基于密度的局部异常点检测 | 第44-62页 |
3.1 引言 | 第44-46页 |
3.2 问题定义 | 第46-49页 |
3.3 不确定数据基于密度的局部异常点检测 | 第49-56页 |
3.3.1 异常点检测算法 | 第49-53页 |
3.3.2 剪枝算法 | 第53-56页 |
3.4 性能分析 | 第56-59页 |
3.4.1 剪枝率测试 | 第57-58页 |
3.4.2 效率测试 | 第58-59页 |
3.4.3 准确度测试 | 第59页 |
3.5 本章小结 | 第59-62页 |
第4章 不确定数据流上参数可变的异常点检测 | 第62-86页 |
4.1 引言 | 第62-63页 |
4.2 问题定义 | 第63-66页 |
4.3 不确定数据流上异常点检测 | 第66-78页 |
4.3.1 基础算法 | 第66-71页 |
4.3.2 异常点概率的界限 | 第71-74页 |
4.3.3 k变化的查询 | 第74-78页 |
4.4 性能分析 | 第78-83页 |
4.4.1 运行时间 | 第79-82页 |
4.4.2 存储空间 | 第82-83页 |
4.4.3 准确度 | 第83页 |
4.5 本章小结 | 第83-86页 |
第5章 不确定数据流上基于距离的异常点检测 | 第86-106页 |
5.1 引言 | 第86页 |
5.2 问题定义 | 第86-88页 |
5.3 检测算法 | 第88-94页 |
5.3.1 算法架构 | 第88-91页 |
5.3.2 增量算法 | 第91-92页 |
5.3.3 SM-tree | 第92-94页 |
5.4 Top-n异常点检测 | 第94-101页 |
5.5 性能分析 | 第101-103页 |
5.5.1 运行时间 | 第101-103页 |
5.5.2 存储空间 | 第103页 |
5.6 本章小结 | 第103-106页 |
第6章 结束语 | 第106-110页 |
6.1 本文工作总结 | 第106-107页 |
6.2 未来工作展望 | 第107-110页 |
参考文献 | 第110-124页 |
致谢 | 第124-126页 |
攻博期间发表的文章 | 第126-128页 |
科研经历 | 第128-130页 |
作者简介 | 第130页 |