机器学习实战 -> 无监督学习

使用后处理来提高聚类性能

利用误差来评价聚类的质量

一种衡量的指标是SSE:误差平方和,该方法更为重视远离簇中心的点。

一种方法是将具有最大SSE值的簇划分成两个簇。将该簇内重新进行分簇。

如果要保持簇的数目不变,可以再讲两个粗合并。合并最小的质心或者合并两个使得SSE枕骨最小的质心。

二分K-均值算法

先将所有点作为一个簇,然后将该粗一分为2,然后再选择其中一个簇进行划分。选择哪一个簇进行划分取决于划分是否可以最大程度的降低SSE的值。

或者

选择SSE最大的簇进行划分,直到簇的数目达到用户指定的数目位置。の3

使用Apriori算法进行关联分析

从频繁项集之中挖掘关联规则

原文地址:https://www.cnblogs.com/chengxuyuanxiaowang/p/4794940.html