def Predict(self, img): """ get class mask of image """ h_ori, w_ori = img.shape[:2] input_size = self.net.input_info["image"].input_data.shape h_resize, w_resize = input_size[-2:] img_pil = Image.fromarray(img) img_resize = img_pil.resize( (w_resize, h_resize), resample=BICUBIC) img_np = np.asarray(img_resize) / 255 # normalize # model input [1, 1, h, w] img_np = np.expand_dims(np.expand_dims(img_np, axis=0), axis=0) input = {'image': img_np} res = self.net.infer(inputs=input) output = res["mask"].squeeze(0) probs = softmax(output) mask = Image.fromarray(np.argmax(probs, axis=0).astype(np.uint8)) mask = mask.resize((w_ori, h_ori), resample=NEAREST) mask_np = np.asarray(mask) return mask_np
时间: 2024-03-30 09:33:33 浏览: 69
这段代码实现了一个神经网络模型对输入的图片进行分割(Semantic Segmentation),返回每个像素点所属的类别。具体来说,该方法的输入是一张图片(img),包含了该图片的高度(h_ori)和宽度(w_ori)。该方法首先将图片进行缩放以符合模型的输入要求(h_resize和w_resize),然后将像素值归一化到 [0, 1] 的范围内。接下来,将归一化后的图片转换为模型的输入格式([1, 1, h, w]),并进行推理,得到模型的输出(output)。然后,将输出进行 softmax 操作,并将每个像素点归类为概率最大的类别。最后,将归类后的结果进行缩放以符合原始图片的大小(h_ori和w_ori),并将其转换为 numpy 数组的形式,作为该方法的返回值(mask_np)。
阅读全文