k均值聚类（1）

分k个簇，起始随机选择k个点为簇的初始质心，选取距离k个质心最近的一个加入那个簇，之后更新质心，即簇内所有数值的平均，之后继续重复直到质心不再变化或者小于一个阈值。

数据集D中n个对象，(D= {o_i=(x_i1,x_i2,...x_in),i=1,2,...n})

簇的集合(C={C_1,C_2,...C_k},C_i={o_1,o_2,...ol} subseteq D)，第i个簇的质心(c_i={y_{i1},y_{i2},...y_{im}})

(y_{ij}=frac{1}{|C_i|} sum_{o_l in C_i} x_{lj})

簇内距离平方和：可以做评价指标，多次以不同的初始质心运行，选取得到最小SSD的结果

(SSD={sum_{i=1}^ksum_{o_j in C_i} d(o_j,c_i)})