4.K均值算法--应用

1. 应用K-means算法进行图片压缩。

读取一张图片

观察图片文件大小,占内存大小,图片数据结构,线性化

用kmeans对图片像素颜色进行聚类

获取每个像素的颜色类别,每个类别的颜色

压缩图片生成:以聚类中收替代原像素颜色,还原为二维

观察压缩图片的文件大小,占内存大小

导入库

from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import sys
import matplotlib.image as img
import numpy as np

# 读取一张图片
image = img.imread("./3.jpg")
print('原图片文件大小:', image.size)
print('原图片占内存大小:', sys.getsizeof(image))
print('原图片的数据结构: ', image)

plt.rcParams['font.sans-serif'] = ['SimHei']#解决中文问题
plt.title("原图片")
plt.imshow(image)
plt.show()

# 用kmeans对图片像素颜色进行聚类
image = image[::3, ::3]  # 降低分辨率
X = image.reshape(-1, 3)
print(image.shape, X.shape)
n_colors = 64
model = KMeans(n_colors)
labels = model.fit_predict(X)  # 获取每个像素的颜色类别
colors = model.cluster_centers_  # 获取每个类别的颜色

new_image = colors[labels].reshape(image.shape)  # 以聚类中收替代原像素颜色,还原为二维
print('压缩图片文件大小:', new_image.size)
print('压缩图片占内存大小:', sys.getsizeof(new_image))
print('压缩图片的数据结构: ', new_image)
img.imsave('E://img/1.jpg', new_image)
plt.title("压缩图片")
plt.imshow(new_image.astype(np.uint8))  # 把颜色平均值转为整数
plt.show()

原图:

 压缩后的图片、

 

2. 观察学习与生活中可以用K均值解决的问题。

 

import pandas as pd
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
data= pd.read_csv('test.csv')
kmeans_model = KMeans(n_clusters=2)
kmeans_model.fit(data)
y_predict1 = kmeans_model.predict(data)
kmeans_model.cluster_centers_
kmeans_model.labels_
plt.scatter(data[1:,3],data[1:,3],c=y_predict1,s=50,cmap="rainbow")
plt.show()

 

观察广州市的房价,数据如下:

 

 

原文地址:https://www.cnblogs.com/Gidupar/p/12732758.html