<数据挖掘导论>读书笔记10聚类分析续

基于原型的聚类

  模糊c均值使用模糊逻辑和模糊集合论的概念,提出一种聚类方案,它很像K均值,但是不需要硬性地将对象分派到一个簇中。模糊c均值算法有时也称为FCM

  混合模型聚类采取这样的访谈,簇集合可以用一个混合分布建模,每个分布对应一个簇。EM(Expectation-Maximization)期望最大化算法 

  基于自组织映射SOM的聚类方法在一个框架内进行聚类,该框架要求簇具有预先指定的相互联系。SOFM/SOM

基于密度的聚类

  基于网格的聚类,其基本思想是将每个属性的可能值分割成许多相邻的区间,创建网格单元的集合。

  子空间聚类

  DENCLUE:基于密度聚类的一张基于核的方案,它用与每个点相关联的影响函数之和对点集的总密度建模。

基于图的聚类

  稀疏化

  最小生成树聚类

  OPOSSUM:使用METIS的稀疏相似度最优划分

  Chameleon:使用动态建模的层次聚类

  共享最近邻相似度SNN:Shared Nearest Neighbor

  jarvis-patrick聚类算法

  SSN密度

  基于SSN密度的聚类

可伸缩的聚类算法

  BIRCH:Balanced Iterative Reducing and Clustering using Hierarchies,基于聚类特征(Clustering Feature,CF)和CF树的概念。其基本思想是,数据点(向量)的簇可以用三元组(N,LS,SS)表示,其中N是簇中点的个数,LS是点的线性和,SS是点的平方和。CF树是一种高度平衡的树。

  CURE:Clustering Using REpresentative是一种聚类算法,它使用各种不同的技术创建一种方法,该方法能够处理大型数据、离散点和具有非球形和非均匀大小的簇的数据。

  

原文地址:https://www.cnblogs.com/davidwang456/p/9705294.html