K-means 聚类

# JJU_干干

1. 先了解几个概念:

  (1)K 值:要聚集的类的个数(即要聚集几个类,类也可称作簇)

  (2)质心(聚类中心):每个类的均值向量(即这个类中所有向量的均值)

  (4)距离度量:常用欧式距离和余弦相似度(如果向量各维度的取值范围差异较大,则需将各维度的取值范围先标准化)

2. 算法流程

  (1)先确定 K 值,即先确定要分为几类。

  (2)从所有的向量中随机选择 K 个向量作为聚类中心

  (3)对于剩下的向量,求各个向量分别到这 K 个聚类中心的距离,和谁最近,就归为哪一类

  (4)归好类后,就有 K 个类,再重新计算着这 K 个类的聚类中心(即求分别求每个类中的向量均值)

  (5)重复执行 (3)-(4),直到满足聚类标准

原文地址:https://www.cnblogs.com/ZZG-GANGAN/p/13759010.html