opencv img_area = img.shape[0] * img.shape[1]
时间: 2024-01-06 20:06:05 浏览: 87
这行代码是用来计算图像的像素总数的,即图像的面积。在OpenCV中,图像的形状可以通过`shape`属性来获取,该属性返回一个三元组,其中包含图像的高度、宽度和通道数。由于在本例中是一幅灰度图像,因此通道数为1。因此,`img.shape[0]`返回图像的高度,`img.shape[1]`返回图像的宽度,两者相乘即得到图像的面积。
相关问题
讲解这段代码:def read_img_and_convert_to_binary(filename): #读取待处理的图片 original_img = cv2.imread(filename) # print(original_img) #将原图分辨率缩小SCALSIZE倍,减少计算复杂度 original_img = cv2.resize(original_img,(np.int(original_img.shape[1]/SCALSIZE),np.int(original_img.shape[0]/SCALSIZE)), interpolation=cv2.INTER_AREA) #降噪 blur = cv2.GaussianBlur(original_img, (5, 5), 0) #将彩色图转化成灰度图 img_gray = cv2.cvtColor(blur,cv2.COLOR_BGR2GRAY) #图片开(opening)处理,用来降噪,使图片中的字符边界更圆滑,没有皱褶 kernel = np.ones((3, 3), np.uint8) opening = cv2.morphologyEx(img_gray, cv2.MORPH_OPEN, kernel) kernel2 = np.ones((3,3), np.uint8) opening = cv2.dilate(opening, kernel2, iterations=1) # Otsu's thresholding after Gaussian filtering # 采用otsu阈值法将灰度图转化成只有0和1的二值图 blur = cv2.GaussianBlur(opening,(13,13),0) #ret, binary_img = cv2.threshold(img_gray, 120, 1, cv2.THRESH_BINARY_INV) ret,binary_img = cv2.threshold(blur,0,1,cv2.THRESH_BINARY_INV+cv2.THRESH_OTSU) return original_img,binary_img
这段代码是一个函数,名为`read_img_and_convert_to_binary`,它的功能是读取一张待处理的图片并将其转换为二值图像。下面是对代码的逐行解释:
1. `original_img = cv2.imread(filename)`:使用OpenCV库的`imread`函数读取指定路径的图片,并将其存储在`original_img`变量中。
2. `original_img = cv2.resize(original_img,(np.int(original_img.shape[1]/SCALSIZE),np.int(original_img.shape[0]/SCALSIZE)), interpolation=cv2.INTER_AREA)`:将原图的分辨率缩小`SCALSIZE`倍,通过调整图像大小减少计算复杂度,结果存储在`original_img`变量中。
3. `blur = cv2.GaussianBlur(original_img, (5, 5), 0)`:使用高斯模糊对`original_img`进行降噪处理,减少图像中的噪点,结果存储在`blur`变量中。
4. `img_gray = cv2.cvtColor(blur,cv2.COLOR_BGR2GRAY)`:将降噪后的彩色图像转换为灰度图像,便于后续处理,结果存储在`img_gray`变量中。
5. `kernel = np.ones((3, 3), np.uint8)`:创建一个3x3的矩阵,用于后续图像形态学操作。
6. `opening = cv2.morphologyEx(img_gray, cv2.MORPH_OPEN, kernel)`:对灰度图像进行形态学开运算(opening),通过腐蚀和膨胀操作使字符边界更加平滑,结果存储在`opening`变量中。
7. `kernel2 = np.ones((3,3), np.uint8)`:创建另一个3x3的矩阵,用于后续膨胀操作。
8. `opening = cv2.dilate(opening, kernel2, iterations=1)`:对开运算后的图像进行膨胀操作,进一步平滑字符边界,结果仍存储在`opening`变量中。
9. `blur = cv2.GaussianBlur(opening,(13,13),0)`:再次使用高斯模糊对图像进行降噪处理,参数(13,13)表示高斯核的大小。
10. `ret, binary_img = cv2.threshold(blur,0,1,cv2.THRESH_BINARY_INV+cv2.THRESH_OTSU)`:使用Otsu阈值法将灰度图像转换为二值图像。该阈值法会自动选择一个合适的阈值,将图像分为黑白两部分,结果存储在`binary_img`变量中。
11. 最后,函数返回原始图像`original_img`和二值图像`binary_img`。
这段代码主要进行了图像预处理的步骤,包括降噪、灰度化、形态学操作和阈值处理,最终得到二值图像以供后续处理使用。
import cv2 import matplotlib.pyplot as plt import numpy as np from skimage.measure import label, regionprops file_url = './data/origin/DJI_0081.jpg' output_url = './DJI_0081_ROI.jpg' def show_img(img, title): cv2.namedWindow(title, cv2.WINDOW_NORMAL) cv2.imshow(title, img) def output_img(img, url): cv2.imwrite(url, img, [int(cv2.IMWRITE_PNG_COMPRESSION), 9]) # 使用2g-r-b分离 src = cv2.imread(file_url) show_img(src, 'src') # 转换为浮点数进行计算 fsrc = np.array(src, dtype=np.float32) / 255.0 (b, g, r) = cv2.split(fsrc) gray = 2 * g - 0.9 * b - 1.1 * r # 求取最大值和最小值 (minVal, maxVal, minLoc, maxLoc) = cv2.minMaxLoc(gray) # 转换为u8类型,进行otsu二值化 gray_u8 = np.array((gray - minVal) / (maxVal - minVal) * 255, dtype=np.uint8) (thresh, bin_img) = cv2.threshold(gray_u8, -1.0, 255, cv2.THRESH_OTSU) show_img(bin_img, 'bin_img') def find_max_connected_component(binary_img): # 输出二值图像中所有的连通域 img_label, num = label(binary_img, connectivity=1, background=0, return_num=True) # connectivity=1--4 connectivity=2--8 # print('+++', num, img_label) # 输出连通域的属性,包括面积等 props = regionprops(img_label) resMatrix = np.zeros(img_label.shape).astype(np.uint8) # 只保留最大的连通域 max_area = 0 max_index = 0 for i in range(0, len(props)): if props[i].area > max_area: max_area = props[i].area max_index = i tmp = (img_label == max_index + 1).astype(np.uint8) resMatrix += tmp resMatrix *= 255 return resMatrix bin_img = find_max_connected_component(bin_img) show_img(bin_img, 'bin_img') # 得到彩色的图像 (b8, g8, r8) = cv2.split(src) color_img = cv2.merge([b8 & bin_img, g8 & bin_img, r8 & bin_img]) output_img(color_img, output_url) show_img(color_img, 'color_img') cv2.waitKey() cv2.destroyAllWindows()
这段代码是用来对一张图片进行处理,找到图片中最大的连通域,并将其保留下来。具体的处理过程如下:
1.读入图片并显示;
2.将图片转换成浮点数类型,方便做计算;
3.使用2g-r-b分离,得到灰度图像;
4.使用minMaxLoc函数找到灰度图像中的最大值和最小值;
5.将灰度图像转换成u8类型,方便做Otsu二值化;
6.使用Otsu二值化将图像进行二值化处理;
7.找到图像中最大的连通域;
8.将连通域保留下来,并输出彩色图像。
需要注意的是,代码中使用了一些第三方库,比如OpenCV和skimage,需要提前安装好。另外,代码中也有一些常量的设置,比如阈值等,可以根据具体需求进行调整。
阅读全文