unsupervised learning: clustering介绍

unsupervised learning

上面是监督学习与无监督学习的比较,监督学习的training set是一组带label(y)的训练集,而无监督学习不带有label(y)。

上图中的监督学习求出决策线,用来区别正负样本点;

clustering是unsupervised learning算法的一种,用来确定数据内部的结构。

clustering算法的一些应用

对客户进行分组clustering来有针对性的营销;

对社交网络(如facebook等)进行分析,找出朋友圈;

利用clustering更好地组织数据中心,将work together的一些资源放在一起来提高效率;

利用clustering来理解星系的形成

原文地址:https://www.cnblogs.com/yan2015/p/5228319.html