4.K均值算法

1. 应用K-means算法进行图片压缩

读取一张图片：

观察图片文件大小，占内存大小，图片数据结构：

线性化，用kmeans对图片像素颜色进行聚类

获取每个像素的颜色类别，每个类别的颜色

压缩图片生成：以聚类中收替代原像素颜色，还原为二维

观察压缩图片的文件大小，占内存大小

三图片展示：

本地图片属性对比：

完整源码如下：

from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
import matplotlib.image as img
import numpy as np
import sys

saber = img.imread('C://Users/无语/saber.jpg')  #导入图片
plt.imshow(saber)
plt.show()

print('原图片大小：',saber.size)
print('原图片内存大小：',sys.getsizeof(saber))
print('原图片维度：',saber.shape)
print('原图片数据结构：
',saber)

# 颜色聚类
X = saber.reshape(-1,3)          # 图片线性化，保留颜色顺序
n_color = 64
model = KMeans(n_color)          # 构建模型，将所有颜色聚类成64种
labels = model.fit_predict(X)    # 训练模型并进行预测
colors = model.cluster_centers_  # 聚类中心
new_saber = colors[labels].reshape(saber.shape)   # 还原具体颜色
plt.imshow(new_saber.astype(np.uint8))
plt.show()

# 按比例压缩图片
print('颜色聚类后图片大小：',new_saber.size)
print('颜色聚类后图片内存大小：',sys.getsizeof(new_saber))
print('压缩后图片大小：',new_saber[::6,::6].size)
print('压缩后图片内存大小：',sys.getsizeof(new_saber[::6,::6]))
print('压缩后图片维度：',new_saber[::6,::6].shape)
print('压缩后图片数据结构：
',new_saber[::6,::6])
img.imsave('C://Users/无语/new_saber.jpg',new_saber[::6,::6].astype(np.uint8))     # 保存压缩后图片

# 展示3张图片
plt.rcParams['font.sans-serif']=['SimHei']
plt.title('原图')
plt.imshow(saber)
plt.show()
plt.title('颜色聚类64种')
plt.imshow(new_saber.astype(np.uint8))
plt.show()
plt.title('降低分辨率')
plt.imshow(new_saber[::6,::6].astype(np.uint8))
plt.show()

2. 观察学习与生活中可以用K均值解决的问题。

从数据-模型训练-测试-预测完整地完成一个应用案例。

这个案例会作为课程成果之一，单独进行评分。