摘要 | 第4-5页 |
ABSTRACT | 第5-6页 |
1 绪论 | 第9-13页 |
1.1 研究目的和意义 | 第9页 |
1.2 研究历史和现状 | 第9-11页 |
1.3 论文结构和研究方法 | 第11-13页 |
1.3.1 论文结构 | 第11页 |
1.3.2 本文研究方法 | 第11-13页 |
2 聚类和k-means算法基本知识 | 第13-19页 |
2.1 聚类定义 | 第13页 |
2.2 聚类的数据结构 | 第13-14页 |
2.3 聚类的数据类型和准则 | 第14-15页 |
2.4 聚类方法 | 第15页 |
2.5 传统k-means算法 | 第15-16页 |
2.6 k-means算法优点和缺点 | 第16-18页 |
2.7 聚类评价准则 | 第18-19页 |
3 加权欧氏距离改进k-means算法 | 第19-27页 |
3.1 加权欧氏距离的定义和性质 | 第19-23页 |
3.1.1 加权欧氏距离定义 | 第19页 |
3.1.2 加权欧氏距离的性质 | 第19-20页 |
3.1.3 加权欧氏距离k-means算法应用 | 第20-23页 |
3.2 变异系数法确定权重 | 第23-25页 |
3.2.1 变异系数法权重计算方法 | 第23页 |
3.2.2 变异系数法加权欧氏距离的应用 | 第23-25页 |
3.3 变异系数法加权欧氏距离k-means算法小结 | 第25-26页 |
3.4 本章小结 | 第26-27页 |
4 k值和初始中心点对k-means算法的改进 | 第27-32页 |
4.1 问题的提出 | 第27页 |
4.2 k值确定方法 | 第27-30页 |
4.2.1 概念的定义 | 第27-28页 |
4.2.2 最优化k值的方法 | 第28-29页 |
4.2.3 k-means算法中k值优化的应用实例 | 第29-30页 |
4.3 初始中心点选取对k-means算法改进 | 第30-32页 |
4.3.1 问题提出 | 第30页 |
4.3.2 建立基本模型 | 第30-31页 |
4.3.3 改进后的k-means算法流程 | 第31-32页 |
5 k-means改进算法的实证分析 | 第32-43页 |
5.1 应用背景意义 | 第32-33页 |
5.2 数据预处理 | 第33页 |
5.3 主成分分析处理数据相关性 | 第33-36页 |
5.4 k值和k个初始中心点的确定 | 第36-37页 |
5.5 使用SPSS进行k-means聚类分析 | 第37-42页 |
5.6 结果解释 | 第42-43页 |
6. 本文总结和展望 | 第43-44页 |
参考文献 | 第44-49页 |
附录:k个初始中心点选取的程序 | 第49-60页 |
致谢 | 第60页 |