机器学习作业3--K均值算法

1). 扑克牌手动演练k均值聚类过程:>30张牌,3类

第一轮:

 第二轮:

 第三轮:

2). *自主编写K-means算法 ,以鸢尾花花瓣长度数据做聚类,并用散点图显示。(加分题)

3). 用sklearn.cluster.KMeans,鸢尾花花瓣长度数据做聚类,并用散点图显示.

 

4). 鸢尾花完整数据做聚类并用散点图显示.

5).想想k均值算法中以用来做什么?

答:K-means算法是典型的基于距离的聚类算法,即对各个样本集采用距离作为相似性的评价指标,若两个样本集的距离越近,其相似度就越大。所以我觉得可以使用K-means算法处理图像的像素,图像常用的编码方式为RGB编码,即用三基色(RED,GREEN,BLUE)表示图像颜色。每个像素由三个8位无符号二进制数(范围从0到255)表示其像素颜色,例如,一个像素的颜色可以用(220,101,25)表示。给定的图像包含这数千种颜色,通过K均值算法,将相似的颜色作为一种,就可以将其颜色的数量降至16种,从而实现图像压缩。

原文地址:https://www.cnblogs.com/m2362563619/p/12694114.html