摘要 | 第1-7页 |
ABSTRACT | 第7-12页 |
1 绪论 | 第12-15页 |
·课题研究背景 | 第12-13页 |
·课题研究现状及意义 | 第13页 |
·课题主要工作 | 第13-14页 |
·论文的结构和组织 | 第14-15页 |
2 数据挖掘技术 | 第15-24页 |
·数据挖掘的定义和数据挖掘系统的组成 | 第15-18页 |
·数据挖掘的数据来源 | 第18页 |
·数据挖掘功能和任务 | 第18-20页 |
·概念/类描述:特征化和区分 | 第18-19页 |
·关联分析 | 第19页 |
·分类和预测 | 第19页 |
·聚类分析 | 第19页 |
·异常检测 | 第19-20页 |
·数据挖掘算法的组件 | 第20-21页 |
·评分函数 | 第20页 |
·优化和搜索方法 | 第20-21页 |
·数据管理策略 | 第21页 |
·数据挖掘的主要问题 | 第21-23页 |
·小结 | 第23-24页 |
3 聚类分析技术 | 第24-35页 |
·聚类分析的定义 | 第25页 |
·聚类分析的数据基础 | 第25-29页 |
·数据属性 | 第25-26页 |
·聚类分析的数据结构 | 第26-27页 |
·不同变量的相异度计算方式 | 第27-29页 |
·不同的聚类类型 | 第29-30页 |
·不同的簇类型 | 第30-31页 |
·聚类算法的分类 | 第31-32页 |
·聚类算法的一般特性 | 第32-33页 |
·选用聚类算法的参考因素 | 第33-34页 |
·小结 | 第34-35页 |
4 聚类算法的改进和完善 | 第35-66页 |
·代表性聚类算法分析 | 第35-37页 |
·基于原型的聚类 | 第35-36页 |
·基于密度的聚类 | 第36页 |
·基于图的聚类 | 第36-37页 |
·可伸缩的聚类算法 | 第37页 |
·基于密度与对象方向的聚类算法分析 | 第37-41页 |
·KADD 算法分析 | 第37-39页 |
·两个输入参数的分析 | 第39-41页 |
·传统算法和KADD 算法小结 | 第41页 |
·算法改进方案一:引入基于网格的动态邻域半径概念 | 第41-43页 |
·思路 | 第41-43页 |
·程序设计 | 第43页 |
·实验分析 | 第43页 |
·算法改进方案二:引入密度阈值的定义 | 第43-45页 |
·思路 | 第43-44页 |
·程序设计 | 第44-45页 |
·实验分析 | 第45页 |
·算法改进方案三:基于密度与密度可达聚类算法的提出 | 第45-59页 |
·算法思路 | 第45-52页 |
·算法模型设计 | 第52-53页 |
·实验分析 | 第53-59页 |
·数据预处理工作 | 第59-64页 |
·程序可处理文件格式要求 | 第59页 |
·数据规范化 | 第59-60页 |
·实验及结果分析 | 第60-64页 |
·针对不同类型变量的算法完善 | 第64-65页 |
·小结 | 第65-66页 |
5 聚类评估方法的设计和实现 | 第66-80页 |
·聚类评估技术研究 | 第66-71页 |
·聚类评估概述 | 第66-67页 |
·非监督簇评估:使用凝聚度和分离度 | 第67-70页 |
·聚类趋势 | 第70-71页 |
·簇有效性的监督度量 | 第71页 |
·评估个体数据对象的方法——数据实例典型性 | 第71-79页 |
·K-最近邻居图 | 第72-73页 |
·数据典型性得分定义 | 第73-75页 |
·算法实现 | 第75-76页 |
·实验分析 | 第76-79页 |
·小结 | 第79-80页 |
6 结合模式评估方法的CADD 算法应用 | 第80-91页 |
·SONAR 卫星数据集介绍 | 第80页 |
·实验方法 | 第80页 |
·结合实例典型性得分对SONAR 聚类 | 第80-83页 |
·几种算法分类精度评估 | 第83-84页 |
·考察结果簇方差 | 第84-90页 |
·变量方差的定义 | 第84-85页 |
·域方差和簇方差的定义 | 第85-86页 |
·从方差角度考察算法性能 | 第86-90页 |
·小结 | 第90-91页 |
7 用户交互界面的设计和实现 | 第91-94页 |
8 结论 | 第94-95页 |
参考文献 | 第95-99页 |
在学研究成果 | 第99-100页 |
致谢 | 第100页 |