首页--工业技术论文--自动化技术、计算机技术论文--自动化基础理论论文--人工智能理论论文

基于蜂群和粗糙集的聚类算法研究

【摘要】:数据的爆炸式增长使我们进入了真正的数据与信息时代。如何从海量数据中获取潜在有用的信息,引导人们做出正确的决策,这就离不开数据挖掘。聚类则以其特有的优点,成为数据挖掘领域中的一个活跃的研究课题。但聚类算法也存在一些缺点,研究如何进一步改进聚类算法的不足,来解决社会实践中遇到的难点,具有非常重要的意义。本文主要以传统的聚类算法为基础,探讨了聚类算法存在的不足,然后研究了蜂群算法、粗糙集以及粒计算的理论知识,最后结合改进的蜂群、粗糙集和粒计算改进传统聚类算法存在的不足。主要工作如下:(1)针对传统K-means聚类算法初始聚类中心随机选取、不能处理边界对象、效率低等问题,本文引入了粒计算和粗糙集相关理论,提出了一种基于粒计算和最大最小距离的初始化方法,并利用粗糙集有效处理了边界数据的聚类问题,最后采用均衡化准则函数来得到更好的聚类效果。实验结果表明:该算法准确率较高,迭代次数较少。(2)针对传统K-mediods聚类算法初始聚类中心选择较敏感、全局搜索能力较差、不稳定等缺点,提出了一种基于改进的人工蜂群的K-mediods聚类算法。该算法首先改进了传统蜂群算法初始蜂群和搜索步长随机选取的缺点,然后将改进的人工蜂群进一步优化K-mediods,以提高聚类算法的性能。实验结果表明:该算法降低了对初始聚类中心的敏感度、具有较高准确率和较强的稳定性。(3)为了改进K-means聚类算法存在的局部收敛、稳定性差等问题,本文提出了一种基于变异精密搜索的蜂群聚类算法。该算法利用密度和距离初始化蜂群,并根据引领蜂的适应度和密度求解跟随蜂的选择概率,再通过变异精密搜索法产生的新解来更新侦查蜂,以避免陷入局部最优,最后结合蜂群与粗糙集来优化K-means。实验结果表明,该算法不仅能有效抑制局部收敛,而且准确率和稳定性均有较大的提高。(4)利用蜜蜂交配优化算法思想,提出了一种蜜蜂交配优化聚类算法。该算法依据密度和距离初始化蜂群,并将粗糙集聚类算法作为工蜂的一种编码,以提高算法的局部搜索能力,最后在迭代过程中不断引入随机种群,增加种群的多样性,提高算法的全局寻优能力。实验表明,该算法能有效抑制早熟收敛,且稳定性较强,聚类效果较好。
【关键词】:数据挖掘 聚类算法 人工蜂群 蜜蜂交配优化算法 粗糙集 粒计算
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP18
论文共68页,点击 下载论文
上一篇:一种基于遗传算法的k均值聚类分析
下一篇:生鲜品配送路径优化--以鲜码头生鲜网为例