超像素SLIC算法实现区域划分技术详解

版权申诉
0 下载量 192 浏览量 更新于2024-10-04 收藏 23KB RAR 举报
资源摘要信息:"SLIC算法用于图像处理中的一种区域划分技术,旨在将传统的像素级图像处理转变为区域级处理,以简化图像分析和特征提取的复杂性。SLIC即简单线性迭代聚类(Simple Linear Iterative Clustering),是通过迭代过程将像素分组到超像素中的一种方法,每个超像素包含一组具有相似颜色和空间连续性的像素。" SLIC算法的核心步骤通常包括初始化超像素的中心,然后通过比较像素点与最近中心点的颜色和空间距离,将像素分配到最近的超像素中心所代表的簇中。随后,算法对每个超像素中心进行迭代更新,直到超像素边界稳定为止。SLIC算法特别适用于图像分割任务,因为它能生成边界清晰、形状规则的超像素,且计算效率高。 在给出的压缩包文件名称列表中,包含了实现SLIC算法及相关处理的一系列MATLAB脚本文件,其中: - slic.m:SLIC算法的主要实现文件,负责核心的超像素生成过程。 - spdbscan.m:一种基于密度的空间聚类算法(Spatial DBSCAN),可能用于预处理阶段以提取图像中的特征点。 - cleanupregions.m:用于清理和优化超像素区域,比如消除过小或形状不规则的区域。 - dbscan.m:密度基于的聚类算法(Density-Based Spatial Clustering of Applications with Noise),用于识别并聚类紧密的空间区域,可能在算法的某个步骤中使用以辅助超像素生成。 - regionadjacency.m:计算和分析区域邻接性的函数,用于确定超像素之间的连接关系。 - mcleanupregions.m:可能为处理多通道图像数据的超像素清理过程。 - finddisconnected.m:用于检测并处理超像素中可能出现的不连通区域。 - renumberregions.m:对超像素区域进行重新编号,以便于后续处理和可视化。 - drawregionboundaries.m:用于绘制超像素边界的函数,可以将分割结果可视化。 - testdbscan.m:可能是一个用于测试DBSCAN算法性能的脚本文件,对算法的稳定性或结果进行验证。 这些文件提供了一整套从超像素生成到处理的完整流程,覆盖了从初步的超像素划分到最终的超像素边界绘制的各个方面。在实际应用中,这些脚本可以对图像进行高效的区域划分处理,有助于后续的图像理解和分析工作,例如在图像分割、目标识别、场景分析等图像处理领域具有广泛的应用价值。

import cv2 import numpy as np import torch import torch.nn.functional as F from skimage.segmentation import slic import matplotlib.pyplot as plt from skimage.segmentation import mark_boundaries from skimage import img_as_float # 定义超像素数量 num_segments = 100 # 加载图像 A 和 B img_a = cv2.imread('img_a.jpg') img_b = cv2.imread('img_b.jpg') # 对图像 A 进行超像素分割,并获取每个超像素块的像素范围 segments_a = slic(img_as_float(img_a), n_segments=num_segments, sigma=5) pixel_ranges = [] for i in range(num_segments): mask = (segments_a == i) indices = np.where(mask)[1] pixel_range = (np.min(indices), np.max(indices)) pixel_ranges.append(pixel_range) # 将像素范围应用到图像 B 上实现超像素分割 segments_b = np.zeros_like(segments_a) for i in range(num_segments): pixel_range = pixel_ranges[i] segment_b = img_b[:, pixel_range[0]:pixel_range[1], :] segment_b = torch.from_numpy(segment_b.transpose(2, 0, 1)).unsqueeze(0).float() segment_b = F.interpolate(segment_b, size=(img_b.shape[0], pixel_range[1] - pixel_range[0]), mode='bilinear', align_corners=True) segment_b = segment_b.squeeze(0).numpy().transpose(1, 2, 0).astype(np.uint8) gray = cv2.cvtColor(segment_b, cv2.COLOR_BGR2GRAY) _, mask = cv2.threshold(gray, 0, 255, cv2.THRESH_BINARY) segments_b[np.where(mask)] = i # 可视化超像素分割结果 fig = plt.figure('Superpixels') ax = fig.add_subplot(1, 2, 1) ax.imshow(mark_boundaries(img_as_float(cv2.cvtColor(img_a, cv2.COLOR_BGR2RGB)), segments_a)) ax = fig.add_subplot(1, 2, 2) ax.imshow(mark_boundaries(img_as_float(cv2.cvtColor(img_b, cv2.COLOR_BGR2RGB)), segments_b)) plt.axis("off") plt.show(),上述代码中segments_a = slic(img_as_float(img_a), n_segments=num_segments, sigma=5)出现错误:ValueError: Cannot convert from object to float64.

2023-05-30 上传

from skimage.segmentation import slic, mark_boundaries import torchvision.transforms as transforms import numpy as np from PIL import Image import matplotlib.pyplot as plt import torch.nn as nn import torch # 定义超像素池化层 class SuperpixelPooling(nn.Module): def init(self, n_segments): super(SuperpixelPooling, self).init() self.n_segments = n_segments def forward(self, x): # 获取超像素标记图 segments = slic(x, n_segments=self.n_segments, compactness=10) # 将超像素标记图转换为张量 segments_tensor = torch.from_numpy(segments).unsqueeze(0).float() # 在超像素维度上进行最大池化 pooled = nn.AdaptiveMaxPool2d((self.n_segments, 1))(x * segments_tensor) # 压缩超像素维度 pooled = pooled.squeeze(3) # 返回池化后的特征图 return pooled # 加载图像 image = Image.open('3.jpg') # 转换为 PyTorch 张量 transform = transforms.ToTensor() img_tensor = transform(image).unsqueeze(0) # 将 PyTorch 张量转换为 Numpy 数组 img_np = img_tensor.numpy().transpose(0, 2, 3, 1)[0] # 使用 SLIC 算法生成超像素标记图 segments = slic(img_np, n_segments=60, compactness=10) # 将超像素标记图转换为张量 segments_tensor = torch.from_numpy(segments).unsqueeze(0).float() # 将超像素索引映射可视化 plt.imshow(segments, cmap='gray') plt.show() # 将 Numpy 数组转换为 PIL 图像 segment_img = Image.fromarray((mark_boundaries(img_np, segments) * 255).astype(np.uint8)) # 保存超像素索引映射可视化 segment_img.save('segment_map.jpg') # 使用超像素池化层进行池化 pooling_layer = SuperpixelPooling(n_segments=60) pooled_tensor = pooling_layer(img_tensor) # 将超像素池化后的特征图可视化 plt.imshow(pooled_tensor.squeeze().numpy().transpose(1, 0), cmap='gray') plt.show() 上述代码出现问题: pooled = nn.AdaptiveMaxPool2d((self.n_segments, 1))(x * segments_tensor) RuntimeError: The size of tensor a (512) must match the size of tensor b (3) at non-singleton dimension 2,如何修改

2023-06-09 上传

rom skimage.segmentation import slic, mark_boundaries import torchvision.transforms as transforms import numpy as np from PIL import Image import matplotlib.pyplot as plt # 加载图像 image = Image.open('3.jpg') # 转换为 PyTorch 张量 transform = transforms.ToTensor() img_tensor = transform(image).unsqueeze(0) # 将 PyTorch 张量转换为 Numpy 数组 img_np = img_tensor.numpy().transpose(0, 2, 3, 1)[0] # 使用 SLIC 算法生成超像素标记图 segments = slic(img_np, n_segments=60, compactness=10) # 可视化超像素索引映射 plt.imshow(segments, cmap='gray') plt.show() # 将超像素索引映射可视化 segment_img = mark_boundaries(img_np, segments) # 将 Numpy 数组转换为 PIL 图像 segment_img = Image.fromarray((segment_img * 255).astype(np.uint8)) # 保存超像素索引映射可视化 segment_img.save('segment_map.jpg') 将上述代码中引入超像素池化代码:import cv2 import numpy as np # 读取图像 img = cv2.imread('3.jpg') # 定义超像素分割器 num_segments = 60 # 超像素数目 slic = cv2.ximgproc.createSuperpixelSLIC(img, cv2.ximgproc.SLICO, num_segments) # 进行超像素分割 slic.iterate(10) # 获取超像素标签和数量 labels = slic.getLabels() num_label = slic.getNumberOfSuperpixels() # 对每个超像素进行池化操作,这里使用平均值池化 pooled = [] for i in range(num_label): mask = labels == i region = img[mask] pooled.append(region.mean(axis=0)) # 将池化后的特征图可视化 pooled = np.array(pooled, dtype=np.uint8) pooled_features = pooled.reshape(-1) pooled_img = cv2.resize(pooled_features, (img.shape[1], img.shape[0]), interpolation=cv2.INTER_NEAREST) print(pooled_img.shape) cv2.imshow('Pooled Image', pooled_img) cv2.waitKey(0),并显示超像素池化后的特征图

2023-06-09 上传
2023-05-30 上传
2023-05-30 上传

from skimage.segmentation import slic, mark_boundaries import torchvision.transforms as transforms import numpy as np from PIL import Image import matplotlib.pyplot as plt import cv2 # 加载图像 image = Image.open('img.png') # 转换为 PyTorch 张量 transform = transforms.ToTensor() img_tensor = transform(image).unsqueeze(0) # 将 PyTorch 张量转换为 Numpy 数组 img_np = img_tensor.numpy().transpose(0, 2, 3, 1)[0] # 使用 SLIC 算法生成超像素标记图 segments = slic(img_np, n_segments=100, compactness=10) # 可视化超像素标记图 segment_img = mark_boundaries(img_np, segments) # 将 Numpy 数组转换为 PIL 图像 segment_img = Image.fromarray((segment_img * 255).astype(np.uint8)) # 保存超像素标记图 segment_img.save('segments.jpg') n_segments = np.max(segments) + 1 # 初始化超像素块的区域 segment_regions = np.zeros((n_segments, img_np.shape[0], img_np.shape[1])) # 遍历每个超像素块 for i in range(n_segments): # 获取当前超像素块的掩码 mask = (segments == i) # 将当前超像素块的掩码赋值给超像素块的区域 segment_regions[i][mask] = 1 # 保存超像素块的区域 np.save('segment_regions.npy', segment_regions) # 加载超像素块的区域 segment_regions = np.load('segment_regions.npy') # 取出第一个超像素块的区域 segment_region = segment_regions[37] segment_region = (segment_region * 255).astype(np.uint8) # 显示超像素块的区域 plt.imshow(segment_region, cmap='gray') plt.show() # 初始化空白图像 output = np.zeros_like(img_np) # 遍历每个超像素块 for i in range(n_segments): # 获取当前超像素块的掩码 mask = segments == i # 将当前超像素块的掩码赋值给输出图像 output[mask] = segment_regions[i] * 255 # 绘制超像素块的边缘 contours, _ = cv2.findContours(mask.astype(np.uint8), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE) cv2.drawContours(output, contours, -1, (255, 255, 0), 1) # 显示超像素块的区域和边缘 plt.imshow(output) plt.show()上述代码出现问题:ValueError: shape mismatch: value array of shape (500,500) could not be broadcast to indexing result of shape (0,3)

2023-06-07 上传
2023-06-07 上传