Data Mining --- Clustering

一、二元变量距离

image

image

二、划分法:K-means聚类(需要确定K)

image

三、层次法:分层聚类(需终止条件)

image

image

*BIRCH:集成分层聚类(CF-tree)

image

*CURE:使用代表聚类

image

四、基于密度的聚类:DBSCAN

1.直接密度可达:

image

2.密度可达:

image

3.密度连通:

image

image

五、基于网格的聚类:STING(统计信息网格)

image

image

六、Outlier检测

1.统计方法:多数情况下不知道数据分布

image

2.index-based algorithm

image

3.nested-loop algorithm

image

4.cell-based algorithm

image

原文地址:https://www.cnblogs.com/jizhiyuan/p/3466703.html