首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

一种基于遗传算法的k均值聚类分析

【摘要】:科学技术的高速发展以及存储技术的提高,使得人们获得的数据量急剧膨胀。“数据海量、知识匮乏”的尴尬状况使得数据挖掘应运而生。数据挖掘能从这海量数据中提取潜在的、对人们有价值的信息,为我们的生产、生活带来很多方便。聚类分析是数据挖掘中的一个重要工具,利用聚类分析可以发现数据属性之间潜在的关系。K均值算法是一种典型的聚类算法,具有收敛速度快、局部搜索能力强等优点。但K均值算法存在着一些缺陷,比如对初始中心点明感,易陷入局部最优。本文针对K均值算法的不足作为出发点,提出了一些改进的方法,主要从以下几方面进行研究:在传统的K-means聚类算法基础上,本文提出了一种基于遗传算法的K-means聚类算法。遗传算法具有很好的全局寻优能力,采用竞争选择算子保存最优染色体,同时交叉算子和变异算法保证产生更优秀的染色体。通过一系列的遗传操作寻找到最佳的初始聚类中心,再执行K均值算法找到最终的聚类中心。提高了聚类的准确率,加快了收敛的速度,算法的稳定性也提高了。通过仿真实验,验证了GA-Kmeans聚类算法的有效性。将混合蛙跳算法与K均值算法结合,本文提出一种基于混合蛙跳算法的K-means聚类算法。混合蛙跳算法是一种智能优化算法,具有GA算法的全局寻优能力,还具有粒子群算法的局部寻优能力。利用混沌搜索优化初始解并且根据种群的适应度方差来判断是否进行K-means算法操作。提高了算法准确率,并且算法更加稳定。
【关键词】:数据挖掘 聚类分析 K均值聚类算法 遗传算法 混合蛙跳算法
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP18
论文共43页,点击 下载论文
上一篇:无人值班变电站巡检机器人的研究及应用
下一篇:基于蜂群和粗糙集的聚类算法研究