瓦尔德法是什么聚类方法 聚类方法( 二 )


K-means通过选择k个中心点来工作 。然后将这些均值用作其聚类的质心:任何最接近给定均值的点都将分配给该均值的聚类 。
分配完所有点后,移动每个群集并获取其包含的所有点的平均值 。这个新的“平均”点是聚类的新均值 。
只需一遍又一遍地重复这两个步骤,直到点分配停止变化!
一旦点分配停止改变,该算法就被认为已经收敛
我们现在将拥有k个不同的聚类,每个聚类的质心更接近其cluster中的每个点,而不是任何其他质心 。再次计算质心不会改变分配,所以停止 。这就是K-means的全部内容,但它是一种非常强大的方法,可以在考虑整个数据集时查找已知数量的聚类 。
有很多方法来初始化你的means 。Forgy方法从数据中随机选择k个随机观测值并将其作为起点 。Random Partition 方法将数据集中的每个点分配给随机cluster,然后根据这些点计算质心并恢复算法 。
虽然K-means是一个NP难问题,但是启发式方法能够在多项式时间内找到对全局最优的适当近似,并且能够有效地处理大数据集,使其在某些情况下成为分层聚类的可靠选择 。
聚类是一个奇怪的世界,拥有更奇怪的技术集合 。这三种方法只是最流行的一些机器学习方法,但它们可以帮助您在机器学习数据中发现未知分组 。集群在探索性数据分析、为其他分析寻找初始化点方面非常有用,而且部署起来也非常简单 。明智地使用聚类可以为您的数据提供令人惊讶的见解 。
【瓦尔德法是什么聚类方法 聚类方法】(今完)

推荐阅读