k均值算法及其优缺点

她呀 2019-04-23 11:17:36

算法：第一步:选K个初始聚类中心，z1(1), z2(1)， .. zK(1), 其中括号内的序号为寻找聚类中心的迭代运算的次序号。聚类中心的向量值可任意设定，例如可选开始的K个模式样本的向量值作为初始聚类中心。第二步:逐个将需分类的模式样本{x}按最小距离准则分配给K个聚类中心中的某一个zj(1)。假设i=j时，，则，其中k为迭代运算的次序号，第一次迭代k=1, Sj表示第j个聚类，其聚类中心为zj。第三步:计算各个聚类中心的新的向量值, zj(k+1), j1,...K. . 求各聚类域中所包含样本的均值向量: 其中Nj为第j个聚类域Sj中所包含的样本个数。以均值向量作为新的聚类中心，可使如下聚类准则函数最小: 在这一步中要分别计算K个聚类中的样本均值向量，所以称之为K-均值算法。第四步:若，j=1,..,K,则返回第二步，将模式样本逐个重新分类，重复迭代运算;若，j=1,2...K, 则算法收敛,计算结束。 K-Means的主要优点: 1) 原理简单，容易实现 2)可解释度较强 K-Means的主要缺点: 1) K值很难确定 2)局部最优 3)对噪音和异常点敏感 4)需样本存在均值(限定数据种类) 5)聚类效果依赖于聚类中心的初始化 6)对于非凸数据集或类别规模差异太大的数据效果不好

...全文

1809 1 打赏收藏转发到动态举报

写回复

1 条回复

切换为时间正序

请发表友善的回复…

发表回复

来瓶霸王防脱发 2019-04-24

打赏
举报

回复

楼主在给大家讲算法吗?

K均值(K-means)聚类算法是一种广泛应用的无监督学习方法，主要用于将数据集划分为K个不同的簇。在K-means算法中，每个簇的中心被定义为该簇内所有数据点的均值，这使得算法的名字中含有“Means”。它的主要目标是...

本文探讨了K均值算法在图像分割中的应用，并分析了其优缺点。虽然存在一定的局限性，但经过改进后的K均值算法在许多实际场景中仍表现出较高的分割精度和效率。存在的问题以及对未来的展望未来的研究可能会聚焦于...

虽然标准的K均值算法简单且易于实现，但它也有一些缺点，如对初始质心敏感、处理非凸形状的类别效果不佳等。为此，可以考虑使用更先进的变种，如Elkan K-means、DBSCAN（密度基空间聚类）、谱聚类等。总结，基于...

**摘要**：本文探讨了K均值算法在高光谱遥感影像非监督分类中的应用及其优势，并通过采用最大最小选心法确定初始类别中心来提升分类效果。文章进一步介绍了基于VC++2005的开发平台实现K均值算法的过程，不仅显著提升...

K均值聚类算法是一种广泛使用的聚类方法，能够将相似的数据对象划分到同一簇中。以下是一个完整的K均值聚类算法的MATLAB程序实现，并附有...尽管存在这些缺点，但K均值聚类算法仍然是聚类分析中一种非常实用的方法。

数据结构与算法

33,029

社区成员

35,337

社区内容

发帖

与我相关

我的任务

社区管理员

加入社区

近7日
近30日
至今

加载中

查看更多榜单

社区公告

暂无公告

试试用AI创作助手写篇文章吧

+ 用AI写文章