机器学习——Mini Batch K-Means算法

  Mini Batch K-Means算法是K-Means算法的一种优化变种,采用小规模的数据子集(每次训练使用的数据集是在训练算法的时候随机抽取的数据子集)减少计算时间,同时试图优化目标函数; Mini Batch K-Means算法可以减少K- Means算法的收敛时间,而且产生的结果效果只是略差于标准K-Means算法

算法步骤如下:
  ●首先抽取部分数据集,使用K-Means算法构建出K个聚簇点的模型
  ●继续抽取训|练数据集中的部分数据集样本数据,并将其添加到模型中,分配给距离最近的聚簇中心点
  ●更新聚簇的中心点值(每次更新都只用抽取出来的部分数据集)
  ●循环迭代第二步和第三步操作,直到中心点稳定或者达到迭代次数,停止计算操作

例如,10000个样本,每次拿1000个样本,做一次K-means,无放回。

  再取1000个......

原文地址:https://www.cnblogs.com/qianchaomoon/p/12129184.html