<数据挖掘导论>读书笔记10聚类分析续

基于原型的聚类

　　模糊c均值使用模糊逻辑和模糊集合论的概念，提出一种聚类方案，它很像K均值，但是不需要硬性地将对象分派到一个簇中。模糊c均值算法有时也称为FCM

　　混合模型聚类采取这样的访谈，簇集合可以用一个混合分布建模，每个分布对应一个簇。EM(Expectation-Maximization)期望最大化算法

　　基于自组织映射SOM的聚类方法在一个框架内进行聚类，该框架要求簇具有预先指定的相互联系。SOFM/SOM

基于密度的聚类

　　基于网格的聚类，其基本思想是将每个属性的可能值分割成许多相邻的区间，创建网格单元的集合。

　　子空间聚类

　　DENCLUE:基于密度聚类的一张基于核的方案，它用与每个点相关联的影响函数之和对点集的总密度建模。

基于图的聚类

　　稀疏化

　　最小生成树聚类

　　OPOSSUM：使用METIS的稀疏相似度最优划分

　　Chameleon：使用动态建模的层次聚类

　　共享最近邻相似度SNN:Shared Nearest Neighbor

　　jarvis-patrick聚类算法

　　SSN密度

　　基于SSN密度的聚类

可伸缩的聚类算法

　　BIRCH:Balanced Iterative Reducing and Clustering using Hierarchies,基于聚类特征（Clustering Feature，CF）和CF树的概念。其基本思想是，数据点(向量)的簇可以用三元组(N,LS,SS)表示，其中N是簇中点的个数，LS是点的线性和，SS是点的平方和。CF树是一种高度平衡的树。

　　CURE:Clustering Using REpresentative是一种聚类算法，它使用各种不同的技术创建一种方法，该方法能够处理大型数据、离散点和具有非球形和非均匀大小的簇的数据。