算法入门系列1:k-means

k-means是一种无监督学习算法,用于聚类。

下图(来自http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html)展示了k-means算法k=2时的聚类过程。

第一步:给定k个中心点,然后依次遍历所有数据点,计算每个数据点到k个中心点的距离,距离最短的就归为该中心点

第二步:利用在第一步的结果重新计算中心点

第三步:循环第一第二步直到k个中心点不再变化。

原文地址:https://www.cnblogs.com/qwj-sysu/p/5439735.html