基于投影的高维数据异常检测研究
摘要 | 第1-4页 |
ABSTRACT | 第4-10页 |
1 绪论 | 第10-15页 |
·选题的意义 | 第10-11页 |
·研究现状 | 第11-13页 |
·挖掘方法与用户交互问题 | 第11-12页 |
·性能问题 | 第12页 |
·数据库类型多样化所涉及的问题 | 第12-13页 |
·论文的组织结构 | 第13-15页 |
2 数据挖掘概述 | 第15-30页 |
·数据挖掘的定义、组成及研究对象 | 第15-17页 |
·数据挖掘的定义 | 第15页 |
·数据挖掘的组成 | 第15-16页 |
·数据挖掘的研究对象 | 第16-17页 |
·数据挖掘的主要模式 | 第17-22页 |
·模式的分类 | 第18-21页 |
·模式的评价 | 第21-22页 |
·数据挖掘方法 | 第22-28页 |
·统计学方法 | 第23页 |
·决策树 | 第23-24页 |
·神经网络 | 第24-25页 |
·遗传进化理论 | 第25页 |
·模糊理论 | 第25-26页 |
·粗糙集理论 | 第26-27页 |
·蚁群仿真 | 第27-28页 |
·数据挖掘应用领域 | 第28-29页 |
·科学研究 | 第28页 |
·市场行销 | 第28页 |
·金融投资 | 第28页 |
·欺诈甄别 | 第28-29页 |
·产品制造 | 第29页 |
·通信网络管理 | 第29页 |
·Internet 应用 | 第29页 |
·本章小结 | 第29-30页 |
3 异常挖掘的研究 | 第30-37页 |
·异常挖掘概述 | 第30-31页 |
·异常检测应用 | 第31-32页 |
·常规异常检测算法思想描述 | 第32-36页 |
·基于统计的算法 | 第32页 |
·基于偏差的算法 | 第32页 |
·基于深度的方法 | 第32页 |
·基于距离的算法 | 第32-34页 |
·基于密度的算法 | 第34-36页 |
·本章小结 | 第36-37页 |
4 面向高维的异常检测算法 | 第37-53页 |
·常见的高维数据 | 第37-38页 |
·购物篮数据 | 第37页 |
·文档数据 | 第37页 |
·多媒体数据 | 第37-38页 |
·时间序列数据 | 第38页 |
·web 数据 | 第38页 |
·基因表达数据 | 第38页 |
·高维空间的特性 | 第38-39页 |
·稀疏性 | 第38-39页 |
·空空间现象 | 第39页 |
·维灾 | 第39页 |
·高维空间对常规算法的影响 | 第39-41页 |
·高维对基于统计算法的影响 | 第39-40页 |
·高维对基于深度算法的影响 | 第40页 |
·高维对基于距离算法的影响 | 第40-41页 |
·高维对基于密度算法的影响 | 第41页 |
·高维异常检测的出路 | 第41-45页 |
·维归约 | 第41-43页 |
·高维索引结构 | 第43页 |
·子空间投影 | 第43-45页 |
·高维空间异常检测算法的标准 | 第45页 |
·问题的描述及定义 | 第45-47页 |
·基本定义 | 第45-46页 |
·频繁项集 | 第46-47页 |
·单调性准则 | 第47页 |
·上界准则 | 第47页 |
·算法的描述 | 第47-50页 |
·算法的复杂度分析 | 第50-51页 |
·实验测试 | 第51-52页 |
·实验环境 | 第51页 |
·合成数据集描述 | 第51页 |
·实验结果分析 | 第51-52页 |
·本章小结 | 第52-53页 |
5 算法改进及原型系统 | 第53-62页 |
·算法的改进 | 第53-55页 |
·改进后算法的结果 | 第55-57页 |
·合成数据集测试比较结果 | 第55-56页 |
·以kdd99 数据集进行测试 | 第56页 |
·实验结果对比图 | 第56-57页 |
·实验结论 | 第57页 |
·算法原型系统的实现 | 第57-61页 |
·系统结构流程图 | 第57-58页 |
·系统主界面 | 第58-59页 |
·单维分类结果分析图 | 第59-60页 |
·多维聚类分析图 | 第60-61页 |
·孤立点辨识图 | 第61页 |
·本章小结 | 第61-62页 |
6 结论及后续工作 | 第62-64页 |
·结论 | 第62页 |
·后续工作 | 第62-64页 |
致谢 | 第64-65页 |
参考文献 | 第65-69页 |
附录 | 第69-75页 |
A.作者在攻读硕士学位期间发表的论文目录 | 第69-70页 |
B. 算法流程图 | 第70-75页 |