中文摘要 | 第3-4页 |
Abstract | 第4页 |
第一章 绪论 | 第8-12页 |
1.1 研究背景及意义 | 第8页 |
1.2 国内外研究现状 | 第8-10页 |
1.3 本文研究的内容 | 第10页 |
1.4 本文的组织结构 | 第10-12页 |
第二章 数据挖掘中的聚类算法 | 第12-30页 |
2.1 聚类算法的基本概念 | 第12-15页 |
2.1.1 聚类的定义 | 第12-13页 |
2.1.2 距离和相似性度量 | 第13-15页 |
2.1.3 类间距离的测度 | 第15页 |
2.2 主要的聚类方法 | 第15-23页 |
2.2.1 基于划分的聚类方法 | 第16-18页 |
2.2.2 基于层次的聚类方法 | 第18-21页 |
2.2.3 基于密度的聚类方法 | 第21-22页 |
2.2.4 基于网格的聚类方法 | 第22页 |
2.2.5 基于模型的聚类方法 | 第22-23页 |
2.2.6 模糊聚类方法 | 第23页 |
2.3 经典聚类算法的比较 | 第23-25页 |
2.4 聚类方法的评价指标 | 第25-30页 |
2.4.1 Dunn系列指数[] | 第26页 |
2.4.2 DB-Index(Davies&Bouldin)[] | 第26-27页 |
2.4.3 标准化互信息量(NMI)[] | 第27页 |
2.4.4 兰德指数(Rand-Index)[] | 第27-29页 |
2.4.5 Jaccard指数[] | 第29-30页 |
第三章 谱聚类方法 | 第30-34页 |
3.1 谱图理论 | 第30-31页 |
3.2 传统的谱聚类方法的框架 | 第31-32页 |
3.3 传统的谱聚类方法存在的问题 | 第32-33页 |
3.4 本章小结 | 第33-34页 |
第四章 基于谱聚类算法的层次聚类算—HSC算法 | 第34-37页 |
4.1 HSC算法 | 第34-35页 |
4.2 算法思想和描述 | 第35-36页 |
4.3 本章小结 | 第36-37页 |
第五章 HSC聚类算法的实验分析 | 第37-58页 |
5.1 实验环境 | 第37页 |
5.2 实验所用数据集 | 第37-38页 |
5.3 实验所用评价标准 | 第38-39页 |
5.4 实验过程 | 第39-40页 |
5.5 实验结果及其分析 | 第40-52页 |
5.5.1 数据集Path-based的聚类结果 | 第40-43页 |
5.5.2 数据集3-Spiral的聚类结果 | 第43-45页 |
5.5.3 数据集Jain's toy的聚类结果 | 第45-47页 |
5.5.4 数据集Circle的聚类结果 | 第47-49页 |
5.5.5 数据集Aggregation的聚类结果 | 第49-51页 |
5.5.6 真实数据集的实验结果 | 第51-52页 |
5.6 时间性能分析 | 第52-53页 |
5.7 HSC算法参数的探讨 | 第53-57页 |
5.7.1 聚类数目的估计 | 第53-54页 |
5.7.2 特征向量个数的选取 | 第54-57页 |
5.8 本章小结 | 第57-58页 |
第六章 总结与展望 | 第58-60页 |
6.1 全文总结 | 第58页 |
6.2 进一步的研究方向 | 第58-60页 |
参考文献 | 第60-63页 |
在学期间的研究成果 | 第63-64页 |
致谢 | 第64页 |