首页--工业技术论文--自动化技术、计算机技术论文--计算技术、计算机技术论文--计算机软件论文--程序设计、软件工程论文--程序设计论文

一种改进的基于层次的聚类和异常检测算法及其在数据挖掘平台上的应用

第1章 引言第1-12页
 1.1 数据挖掘综述第7-10页
  1.1.1. 数据挖掘定义第7页
  1.1.2. 数据挖掘的分类第7-8页
  1.1.3. 数据挖掘研究的发展第8-10页
 1.2 本文的研究动机第10-11页
 1.3 本文组织第11-12页
第2章 聚类和异常检测综述第12-17页
 2.1 聚类简介第12-13页
 2.2 聚类研究现状第13-16页
  2.2.1. 聚类方法的分类第13-14页
  2.2.2. 聚类研究热点第14-15页
  2.2.3. 需要研究的方向第15-16页
 2.3 异常检测研究和进展第16-17页
第3章 基于层次的聚类方法第17-38页
 3.1 层次方法概述第17-21页
  3.1.1. 凝聚的和分裂的层次聚类第17-18页
  3.1.2. 簇间距离度量方法第18-20页
  3.1.3. 聚类特征和聚类特征树第20-21页
 3.2 传统层次方法的缺陷第21-24页
  3.2.1. 非球形簇和尺寸非均匀簇分裂及孤立点敏感第21-23页
  3.2.2. 大数据集的处理第23-24页
 3.3 使用多代表点和多阶段聚类的CURE第24-38页
  3.3.1. 相关工作介绍第24-26页
  3.3.2. 算法概述第26-27页
  3.3.3. 算法实现第27-31页
  3.3.4. 时间复杂度和空间复杂度分析第31页
  3.3.5. 对大数据集的处理第31-33页
  3.3.6. 对孤立点的处理第33页
  3.3.7. 实验结果对比第33-35页
  3.3.8. 对参数的敏感度分析第35-38页
第4章 基于距离的异常检测第38-43页
 4.1 异常检测简介第38页
 4.2 基于距离的异常检测第38-42页
  4.2.1. 循环嵌套连接(Nested-loop join)第40页
  4.2.2. 基于索引的连接第40-41页
  4.2.3. 基于划分的算法第41-42页
 4.3 CURE算法中对异常检测的处理及缺陷第42-43页
第5章 采样技术第43-55页
 5.1 随机采样第43-45页
  5.1.1. 随机采样算法在CURE中的应用第43-44页
  5.1.2. 随机采样的缺陷第44-45页
 5.2 基于杂凑的密度偏向采样第45-47页
  5.2.1. 采样的性质第45-46页
  5.2.2. 近似密度偏向的采样第46-47页
 5.3 密度偏向的采样第47-55页
  5.3.1. 内核估计器第48-50页
  5.3.2. 密度偏向的采样技术第50-52页
  5.3.3. 密度偏向采样在聚类和异常检测中应用第52-55页
第6章 总结和展望第55-58页
 6.1 总结第55-56页
 6.2 将来的工作第56-58页
  6.2.1. 聚类研究第56页
  6.2.2. 数据挖掘描述语言的研究第56-57页
  6.2.3. 异常检测研究第57-58页
附录: CIAS智能客户分析系统简介第58-71页
参考文献第71-74页
致谢第74页

论文共74页,点击 下载论文
上一篇:银行并购与中国银行业的选择
下一篇:脉冲预电离纵向放电扩散冷却CO2激光器研究