K-means图片压缩：从255色到64色，文件大小对比

26 浏览量更新于2024-08-31 收藏 390KB PDF 举报

K-means算法是一种常用的无监督机器学习方法，其主要应用于数据集的聚类分析，通过将数据点分组到最近的中心（质心）来实现。在本示例中，我们利用K-means算法进行图片压缩，以减少存储空间和内存占用。首先，我们从sklearn库导入必要的工具，如`load_sample_image`用于加载图像数据，`KMeans`用于执行聚类，以及`matplotlib`用于图像处理。选择一张图片（例如本地的'image2.jpg'），我们将图片转换为一维数组，以便于K-means算法处理。原始图片的形状`(height, width, channels)`经过降维后变为`(num_pixels, channels)`，这里的`channels`通常为RGB三通道。 K-means算法的核心是通过迭代优化将像素点分配到离它们最近的质心（颜色簇中心）代表的类别。在这个例子中，我们设置簇的数量为64（`n_colors=64`），模型通过`fit_predict`方法对所有像素进行分类，得到每个像素的类别标签。然后，我们使用这些标签和质心（颜色簇）重新构建压缩后的图片。压缩过程是将每个像素点替换为其所属颜色簇的平均颜色，这实质上是对图像的一种简化的表示，牺牲了一部分细节以换取更小的存储空间。压缩后的图片通过`imshow`函数展示，可以看到颜色较原图更为简化。为了进一步减小文件大小，我们还进行了第二次压缩，即每三个像素取一个，这种方法称为下采样或低分辨率显示。再次使用`imshow`展示处理后的图片。在代码执行过程中，我们通过`sys.getsizeof()`函数测量了原始图片和压缩图片的内存占用。这有助于评估压缩效果，因为较小的文件大小往往对应于更少的内存消耗。通过K-means算法对图片进行压缩后，虽然可能牺牲一定的视觉质量，但可以显著降低存储需求，这对于存储容量有限的应用场景，如移动设备或者云端存储，具有重要意义。然而，K-means算法对于非凸形状的聚类效果可能不佳，并且对于噪声和异常值敏感，所以在实际应用时可能需要根据具体需求进行调整。

K均值算法均值算法–应用应用

1应用应用K-means算法进行图片压缩算法进行图片压缩

读取一张图片

观察图片文件大小，占内存大小，图片数据结构，线性化

用kmeans对图片像素颜色进行聚类

获取每个像素的颜色类别，每个类别的颜色

压缩图片生成：以聚类中收替代原像素颜色，还原为二维

观察压缩图片的文件大小，占内存大小

代码如下：

from sklearn.datasets import load_sample_image

from sklearn.cluster import KMeans

import matplotlib.pyplot as plt

import numpy as np

import matplotlib.image as mpimg

import sys

#加载样本图像

# image = load_sample_image('china.jpg')

#加载本地图片

image = mpimg.imread('image2.jpg')

#降维（将二维图片变成一维）

X = image.reshape(-1,3)

print(image.shape,X.shape)

#进行聚类将255*255*255聚成64类

n_colors=64

model=KMeans(n_colors)

#一维(273280, 3)对每一个像素进行分类

labels=model.fit_predict(X)

#将273280分成64类

colors=model.cluster_centers_

new_image=colors[labels].reshape(image.shape)

#显示原图片

plt.imshow(image)

plt.show()

#显示压缩后的图片

new_image=new_image.astype(np.uint8)

plt.imshow(new_image)

plt.show()

#二次压缩（每三个像素取一个）

new_image=new_image.astype(np.uint8)[::3,::3] plt.imshow(new_image)

plt.show()

print("image Size:",sys.getsizeof(image))

print("new_image Size:",sys.getsizeof(new_image))

import matplotlib.image as img

img.imsave('F:\01.jpg',image)

img.imsave('F:\02.jpg',new_image)

原图：

下载后可阅读完整内容，剩余5页未读，立即下载

weixin_38740328

粉丝: 4
资源: 863

K-means图片压缩：从255色到64色，文件大小对比

机器学习十大算法.pdf

蜂群算法 最新论文1

k均值算法有哪些不足之处_聚类之K均值（K-means）算法

k 均值算法能否找到全局的最优解

对比K均值算法与DBSCAN算法的优缺点

对图像的k均值算法算法

k均值算法需要注意哪些地方

基于k均值算法的毕业设计

模糊k均值算法程序matlab

k均值算法MATLAB

最新资源

蜂群算法最新论文1