基于异常检测的改进K-means算法研究

摘要	第4-5页
ABSTRACT	第5页
1 绪论	第8-12页
1.1 研究背景及意义	第8-9页
1.2 国内外研究现状	第9-10页
1.3 论文的主要工作	第10页
1.4 论文的组织结构	第10-12页
2 聚类分析算法研究	第12-25页
2.1 聚类分析概述	第12-13页
2.1.1 聚类算法的概念与性质	第12页
2.1.2 类簇的定义	第12-13页
2.2 常用聚类方法	第13-15页
2.2.1 基于网络分布的聚类算法	第14页
2.2.2 基于划分的聚类算法	第14页
2.2.3 基于层次结构的聚类算法	第14-15页
2.3 原始K-means聚类算法	第15-16页
2.3.1 原始K-means算法介绍	第15页
2.3.2 K-means算法聚类流程	第15-16页
2.4 算法缺陷及现有改进方法	第16-18页
2.4.1 受离群点影响较大	第16-17页
2.4.2 对初始质心的选择依赖性强	第17页
2.4.3 现有改进方法	第17-18页
2.5 数据类型与相似度测量	第18-21页
2.5.1 聚类分析的数据类型	第18-19页
2.5.2 聚类算法的相似度测量	第19-21页
2.6 准则函数与评价方法	第21-24页
2.6.1 内部度量函数	第22页
2.6.2 外部度量函数	第22-23页
2.6.3 聚类结果评价方法	第23-24页
2.7 本章小结	第24-25页
3 K-means聚类算法改进	第25-36页
3.1 K-means算法改进方向	第25-26页
3.1.1 异常点隔离策略	第25页
3.1.2 初始聚类中心选择策略	第25-26页
3.2 数据异常度计算	第26-28页
3.2.1 异常度计算原理	第26页
3.2.2 异常度计算过程	第26-28页
3.3 离群过滤比与异常度系数阈值	第28-29页
3.3.1 离群值过滤比例	第28页
3.3.2 异常度系数阈值	第28-29页
3.4 初始聚类中心选取	第29页
3.5 改进K-means算法流程	第29-30页
3.6 实际聚类流程	第30-35页
3.6.1 i Tree构建流程	第31-33页
3.6.2 改进K-means算法优化聚类	第33-34页
3.6.3 聚类结果分析	第34-35页
3.7 本章小结	第35-36页
4 实验仿真	第36-48页
4.1 数据准备及预处理	第36-39页
4.2 聚类质量评估	第39页
4.3 实验及结果分析	第39-47页
4.3.1 标准数据集实验	第39-42页
4.3.2 高维数据集实验	第42-44页
4.3.3 不同离群值过滤比例实验	第44-47页
4.4 本章小结	第47-48页
5 结论与展望	第48-49页
5.1 结论	第48页
5.2 展望	第48-49页
参考文献	第49-52页
个人简介	第52-53页
致谢	第53-54页
附录	第54-65页