机器学习笔记15-----聚类

1.聚类的主要内容

决策树、随机森林、SVM等算法用于回归和分类问题,都是给定输入x,和对应的给定结果值y(有监督),通过训练得到模型y=f(x),通过模型得到y的预测值,比较预测值与真实值。

聚类(无监督)是对输入的(x1,x2,...xm),若x为n维,则该数据实际是m*n维的矩阵,当对m个数据进行处理,分别归到k个簇中,则数据会转换为m*k维矩阵,这就实现了降维

2.聚类的定义

注意:当p=2时,就是欧式距离。

3.聚类的基本事项

k-means算法进行聚类,初值对聚类结果是有影响的,要注意初值的选取。

4.层次聚类方法

5.密度聚类

原文地址:https://www.cnblogs.com/luckyplj/p/12697351.html