基于密度和距离的K-means算法研究与应用

摘要	第3-4页
Abstract	第4页
1 绪论	第7-11页
1.1 研究背景和选题意义	第7-8页
1.2 国内外的研究现状	第8-9页
1.3 本文的主要工作	第9-10页
1.4 论文组织结构	第10-11页
2 相关技术介绍	第11-21页
2.1 数据挖掘的概念	第11-14页
2.1.1 数据挖掘的任务	第11-12页
2.1.2 数据挖掘技术的主要方法	第12-14页
2.2 聚类分析概述	第14-16页
2.2.1 聚类分析的概念	第14页
2.2.2 聚类分析方法	第14-15页
2.2.3 聚类分析的相似性度量	第15-16页
2.2.4 聚类分析的准则函数	第16页
2.3 k-means算法	第16-19页
2.3.1 k-means算法的概念	第16-18页
2.3.2 K-means算法的缺点	第18-19页
2.4 本章小结	第19-21页
3 基于密度和距离的K-means算法改进	第21-33页
3.1 基本概念、定义及总结	第21-22页
3.2 ICCk-means算法介绍	第22-24页
3.3 IDCluster算法介绍	第24-27页
3.4 IDk-means算法	第27-29页
3.4.1 IDk-means算法介绍	第27页
3.4.2 IDk-means算法描述	第27-29页
3.5 实验结果	第29-31页
3.6 本章小结	第31-33页
4 IDk-means算法在Spark平台上的实现	第33-45页
4.1 Spark计算框架介绍	第33-34页
4.1.1 Spark架构设计	第33-34页
4.1.2 Spark的运行逻辑	第34页
4.2 Spark部署	第34-35页
4.3 IDk-means算法在Spark平台上的实现	第35-43页
4.3.1 IDk-means算法的并行化分析	第35-37页
4.3.2 IDk-means算法并行化实现	第37-43页
4.4 本章小结	第43-45页
5 基于改进K-means算法的移动客户细分	第45-55页
5.1 客户细分的概念	第45-46页
5.2 数据准备阶段	第46-48页
5.2.1 数据获取	第46-48页
5.2.2 数据预处理	第48页
5.3 系统设计与实现	第48-53页
5.4 本章小结	第53-55页
6 总结和展望	第55-57页
致谢	第57-59页
参考文献	第59-63页
在校学习期间发表的论文、专利、获奖等评价情况	第63页