致谢 | 第4-5页 |
摘要 | 第5-6页 |
Abstract | 第6-7页 |
1 引言 | 第13-18页 |
1.1 选题及研究背景 | 第13-14页 |
1.2 研究问题的范围 | 第14-15页 |
1.3 研究思路和框架 | 第15-18页 |
2 文献综述 | 第18-62页 |
2.1 数据挖掘 | 第18-20页 |
2.2 高维数据挖掘 | 第20-36页 |
2.2.1 高维数据特点 | 第21-22页 |
2.2.2 高维数据之间的相似性度量 | 第22-26页 |
2.2.3 高维数据的属性类型 | 第26-28页 |
2.2.4 高维数据的降维方法 | 第28-34页 |
2.2.5 高维数据挖掘应用 | 第34-36页 |
2.3 聚类分析 | 第36-46页 |
2.3.1 传统聚类方法 | 第36-38页 |
2.3.2 高维空间聚类分析 | 第38-40页 |
2.3.3 混合属性数据聚类 | 第40-43页 |
2.3.4 聚类簇中心初始化 | 第43-46页 |
2.4 稀疏表示理论及应用 | 第46-55页 |
2.4.1 稀疏表示理论 | 第46-49页 |
2.4.2 局部约束线性编码 | 第49-50页 |
2.4.3 局部约束稀疏表示 | 第50-53页 |
2.4.4 稀疏表示应用 | 第53-55页 |
2.5 数据缺失问题 | 第55-62页 |
2.5.1 缺失数据的产生及原因 | 第55-56页 |
2.5.2 缺失数据的主要填补方法 | 第56-60页 |
2.5.3 已有方法的主要问题 | 第60-62页 |
3 基于稀疏表示的混合属性缺失数据填补方法 | 第62-85页 |
3.1 算法理论框架 | 第62-63页 |
3.2 缺失数据填补估计方法 | 第63-65页 |
3.3 实验设计及分析 | 第65-84页 |
3.3.1 字典大小对填补结果的影响 | 第67-75页 |
3.3.2 字典大小对计算时间的影响 | 第75-79页 |
3.3.3 正则化参数敏感性分析 | 第79-84页 |
3.4 本章小结 | 第84-85页 |
4 基于K-SVD的混合属性数据谱聚类算法 | 第85-103页 |
4.1 相关算法理论基础 | 第85-90页 |
4.2 K-SVD算法 | 第90-92页 |
4.3 实验设计及分析 | 第92-102页 |
4.4 本章小结 | 第102-103页 |
5 基于密度的混合属性数据聚类中心初始化方法 | 第103-117页 |
5.1 基于密度的混合属性数据聚类中心初始化方法 | 第103-105页 |
5.2 实验设计及分析 | 第105-116页 |
5.2.1 字典大小对聚类准确率的影响 | 第106-109页 |
5.2.2 ADCC方法对聚类准确率的影响 | 第109-112页 |
5.2.3 不同种类的混合属性数据对ADCC方法的影响 | 第112-113页 |
5.2.4 算法运行时间分析 | 第113-114页 |
5.2.5 ADCC和MTDimpute对聚类准确率的影响 | 第114-116页 |
5.3 本章小结 | 第116-117页 |
6 结论 | 第117-119页 |
参考文献 | 第119-135页 |
作者简历及在学研究成果 | 第135-138页 |
学位论文数据集 | 第138页 |