数据挖掘中聚类方法的研究
中文摘要 | 第2-3页 |
ABSTRACT | 第3页 |
第一章 绪论 | 第8-26页 |
1.1 本文的选题背景与研究意义 | 第8-9页 |
1.2 数据挖掘概论 | 第9-12页 |
1.2.1 数据挖掘定义 | 第9-10页 |
1.2.2 数据挖掘系统的分类 | 第10-11页 |
1.2.3 数据挖掘系统的功能 | 第11-12页 |
1.3 聚类分析 | 第12-16页 |
1.3.1 聚类的定义 | 第12-13页 |
1.3.2 数据对象间的相异度 | 第13-15页 |
1.3.3 数据挖掘对聚类分析的要求 | 第15-16页 |
1.4 主要聚类方法及其研究进展评述 | 第16-23页 |
1.4.1 划分方法 | 第16-18页 |
1.4.2 层次方法 | 第18-20页 |
1.4.3 基于密度的方法 | 第20页 |
1.4.4 基于网格的方法 | 第20-21页 |
1.4.5 基于模型的方法 | 第21-23页 |
1.5 本文的主要内容和创新点 | 第23-26页 |
第二章 几种主要聚类方法 | 第26-39页 |
2.1 自组织特征映射神经网络 | 第26-33页 |
2.1.1 SOFM模型 | 第26-28页 |
2.1.2 动态增长模型GSOM | 第28-31页 |
2.1.3 层次动态增长模型GHSOM | 第31-33页 |
2.2 基于密度的聚类算法DBSCAN | 第33-34页 |
2.3 基于网格的聚类算法CLIQUE | 第34-35页 |
2.4 多代表点层次聚类方法CURE | 第35-37页 |
2.5 基于参考点和密度的快速聚类方法CURD | 第37-39页 |
第三章 基于神经网络的聚类方法 | 第39-56页 |
3.1 引言 | 第39-40页 |
3.2 树型动态增长模型TGSOM | 第40-49页 |
3.2.1 网络结构 | 第40-41页 |
3.2.2 基本概念 | 第41页 |
3.2.3 训练算法 | 第41-43页 |
3.2.4 参数选择 | 第43-44页 |
3.2.5 实验结果与讨论 | 第44-49页 |
3.2.5.1 实验 | 第46-47页 |
3.2.5.2 实验 | 第47-49页 |
3.3 层次树型动态增长模型HTGSOM | 第49-54页 |
3.3.1 网络结构 | 第50页 |
3.3.2 训练算法 | 第50-51页 |
3.3.3 参数选择 | 第51-53页 |
3.3.4 实验结果与讨论 | 第53-54页 |
3.4 本章小节 | 第54-56页 |
第四章 基于网格、密度及距离的聚类方法 | 第56-71页 |
4.1 引言 | 第56-57页 |
4.2 方法基础 | 第57-60页 |
4.2.1 数学形态学简介 | 第57页 |
4.2.2 腐蚀运算 | 第57-58页 |
4.2.3 类边界识别 | 第58-59页 |
4.2.4 超球半径 | 第59-60页 |
4.3 CUBN算法 | 第60-64页 |
4.3.1 主程序 | 第61页 |
4.3.2 边界点识别算法 | 第61-62页 |
4.3.3 噪声点消除算法 | 第62页 |
4.3.4 边界点归类算法 | 第62-63页 |
4.3.5 内部点归类算法 | 第63页 |
4.3.6 子类合并算法 | 第63-64页 |
4.4 算法分析 | 第64-67页 |
4.4.1 参数选择 | 第64-65页 |
4.4.2 聚类能力 | 第65-66页 |
4.4.3 计算复杂度 | 第66-67页 |
4.5 实验结果与讨论 | 第67-70页 |
4.5.1 实验1 | 第67-69页 |
4.5.2 实验2 | 第69-70页 |
4.6 本章小节 | 第70-71页 |
第五章 基于代表点的层次聚类方法 | 第71-84页 |
5.1 引言 | 第71-72页 |
5.2 CMM聚类算法 | 第72-77页 |
5.2.1 概念 | 第72-73页 |
5.2.2 算法描述 | 第73-77页 |
5.2.2.1 CMM主程序 | 第73-74页 |
5.2.2.2 原子聚类算法 | 第74-75页 |
5.2.2.3 原子簇合并算法 | 第75-76页 |
5.2.2.4 子簇合并算法 | 第76-77页 |
5.3 算法分析 | 第77-79页 |
5.3.1 参数设置 | 第77页 |
5.3.2 时间复杂度分析 | 第77-78页 |
5.3.3 聚类质量分析 | 第78页 |
5.3.4 噪声点处理 | 第78-79页 |
5.4 实验结果与讨论实验 | 第79-82页 |
5.4.1 二维数据 | 第79-81页 |
5.4.2 二维数据 | 第81-82页 |
5.4.3 高维数据 | 第82页 |
5.5 CMM方法与CURD方法的比较 | 第82页 |
5.6 本章小结 | 第82-84页 |
第六章 基于参考点、密度及神经网络的聚类方法 | 第84-96页 |
6.1 引言 | 第84-85页 |
6.2 ViSOM模型及训练算法 | 第85-87页 |
6.3 RDVS方法 | 第87-91页 |
6.3.1 定义 | 第87-89页 |
6.3.2 算法描述 | 第89-91页 |
6.3.2.1 寻找代表点 | 第89-90页 |
6.3.2.2 计算代表点密度 | 第90-91页 |
6.3.2.3 对代表点进行聚类 | 第91页 |
6.4 算法分析 | 第91-93页 |
6.4.1 参数设置 | 第91-92页 |
6.4.2 算法效率分析 | 第92页 |
6.4.3 聚类质量分析 | 第92-93页 |
6.5 实验结果与讨论实验 | 第93-95页 |
6.5.1 二维数据 | 第93-94页 |
6.5.2 高维数据 | 第94-95页 |
6.6 本章小结 | 第95-96页 |
第七章 总结与展望 | 第96-98页 |
7.1 全文总结 | 第96-97页 |
7.2 存在的问题和研究前景展望 | 第97-98页 |
参考文献 | 第98-109页 |