4.K均值算法--应用

1. 应用K-means算法进行图片压缩

读取一张图片

观察图片文件大小,占内存大小,图片数据结构,线性化

用kmeans对图片像素颜色进行聚类

获取每个像素的颜色类别,每个类别的颜色

压缩图片生成:以聚类中收替代原像素颜色,还原为二维

观察压缩图片的文件大小,占内存大小

答:

读取一张图片并显示出这个图片的文件大小以及占内存的大小:

 

初始化的原图片是这样的:

原图片的详细信息运行结果:

通过kmeans对图片进行像素分辨率等压缩,并显示出压缩后的详细信息,保存成新的图片命名为0034:

 经过处理后,可以得到压缩后图片的文件大小,占用内存大小以及数据结构:

在文件的资源管理器中查看压缩前后图片的大小差异: 

 将图片进行二次压缩:

 展示压缩后的图片,对比第一次压缩以及第二次压缩的画质,可以看出明显压缩:

第一次压缩后:

 第二次压缩后:

 

2. 观察学习与生活中可以用K均值解决的问题。

从数据-模型训练-测试-预测完整地完成一个应用案例。

答:

在生活中,也可以用K均值来解决问题,在这里我用的是二手房链家网站的数据来进行应用。

在这里我们选用在广州市白云区的二手房

首先通过网页爬虫来对数据进行存储为csv表格,将其命名为学号姓名并进行简单的预处理:

 

 运用K均值算法来研究白云区的楼盘价格跟房的面积大小的关系,通过数据可视化可以直观的看到:

具体代码如下:

 通过K均值算法的运用,我们可以发现楼盘价格跟房屋的面积大小有着十分密切的关系,面积越大,房价越高。

原文地址:https://www.cnblogs.com/heiyedeshihouh/p/12731682.html