致谢 | 第4-5页 |
摘要 | 第5-6页 |
Abstract | 第6页 |
1 引言 | 第12-16页 |
1.1 研究背景和意义 | 第12-13页 |
1.2 研究内容和创新点 | 第13-16页 |
2 文献综述 | 第16-40页 |
2.1 数据库知识发现与数据挖掘 | 第16-18页 |
2.1.1 数据库知识发现 | 第16页 |
2.1.2 数据挖掘 | 第16-17页 |
2.1.3 变量类型 | 第17-18页 |
2.2 聚类分析 | 第18-30页 |
2.2.1 聚类分析流程 | 第19-20页 |
2.2.2 聚类分析算法 | 第20-30页 |
2.3 聚类有效性评价 | 第30-39页 |
2.3.1 聚类有效性指标的种类 | 第31-34页 |
2.3.2 外部聚类有效性指标 | 第34-36页 |
2.3.3 分类变量数据聚类有效性内部指标 | 第36-39页 |
2.4 本章小结 | 第39-40页 |
3 基于证据的聚类有效性指标评价能力相对度量方法 | 第40-67页 |
3.1 现有聚类有效性内部指标分析 | 第40-49页 |
3.1.1 内部指标构成及分类 | 第40-42页 |
3.1.2 内部指标适用性问题 | 第42-49页 |
3.2 D-S证据理论 | 第49-50页 |
3.2.1 证据理论的分析框架 | 第49-50页 |
3.2.2 证据理论的合成规则 | 第50页 |
3.3 基于证据的评价能力相似性分析 | 第50-57页 |
3.3.1 评价能力的证据提取 | 第51-52页 |
3.3.2 信任分配函数合成 | 第52-54页 |
3.3.3 外部指标评价能力相似性分析 | 第54-57页 |
3.4 基于外部信息的内部指标评价能力相对度量 | 第57-66页 |
3.4.1 基于外部信息的证据合成方法 | 第57-58页 |
3.4.2 现有内部指标评价能力度量 | 第58-66页 |
3.5 本章小结 | 第66-67页 |
4 基于信息熵的分类变量数据聚类有效性内部评价指标 | 第67-89页 |
4.1 熵理论 | 第67-69页 |
4.1.1 熵与信息论 | 第67-68页 |
4.1.2 信息增益 | 第68-69页 |
4.2 聚类有效性内部评价指标CUBAGE | 第69-74页 |
4.2.1 基于平均信息增益的类间分离度 | 第69-71页 |
4.2.2 CUBAGE指标的提出 | 第71-74页 |
4.2.3 CUBAGE指标的时间复杂度 | 第74页 |
4.3 CUBAGE指标评价能力实验分析 | 第74-88页 |
4.3.1 类数量已知的评价能力分析 | 第75-80页 |
4.3.2 类数量未知的评价能力分析 | 第80-86页 |
4.3.3 CUBAGE指标扩展性实验 | 第86-88页 |
4.4 本章小节 | 第88-89页 |
5 基于分类变量数据聚类有效性的划分式聚类算法 | 第89-111页 |
5.1 k-CUBAGE聚类算法 | 第89-95页 |
5.1.1 聚类目标函数 | 第90页 |
5.1.2 算法迭代过程 | 第90-93页 |
5.1.3 算法示例 | 第93-94页 |
5.1.4 迭代过程的收敛 | 第94-95页 |
5.2 基于聚集度的初始类确定方法 | 第95-100页 |
5.2.1 峰值密度聚类思想 | 第95-96页 |
5.2.2 预聚类 | 第96页 |
5.2.3 对象聚集度和顺序类间差异度 | 第96-98页 |
5.2.4 初始类确定方法 | 第98-100页 |
5.3 实验分析 | 第100-110页 |
5.3.1 收敛性分析 | 第100-103页 |
5.3.2 聚类质量分析 | 第103-107页 |
5.3.3 参数敏感性分析 | 第107-110页 |
5.4 本章小结 | 第110-111页 |
6 结论 | 第111-114页 |
参考文献 | 第114-122页 |
作者简历及在学研究成果 | 第122-126页 |
学位论文数据集 | 第126页 |