实验内容 1.熟悉编程环境; 2.完成图像读⼊、显⽰、写出; 3.完成⽂件夹下全部图像⽂件的读⼊、显⽰、写出; 4.截取⼀张图像中某⼀坐标范围的区域,并保存。如坐标(x,y),x=[100,200], y = [100,250]; 5.定义函数实现图像幂次变换,处理图1-2,其中c=1,gamma = 3,4,5; 6.定义五个函数分别实现图像算数运算,包括:加,减,点乘,缩放(2倍,0.5倍),旋转(90度,180 度); 7.定义四个函数分别实现图像的逻辑运算,包括:与,或,⾮,异或。 8.编程实现在同⼀张图中绘制⼦图,分别展⽰原图与实验4、5、6、7中各运算的结果。 9.设计题:根据图像基本运算,设计两种不同⽅法,实现对图“1-1-2.png”中 ⽴⽅体的提取。 算法设计 1.⼀幅分辨率640*480的彩⾊图像,读⼊到中存储形式是怎么样的,数据类型是什么? 2.批量读取⽂件夹下多张⼤⼩相同的图像,在主⽂件中调⽤图像基本运算函数,输出并保存 相应的五种运算结果。 3.根据实验内容4,分析图像中坐标分布(圆点位置,xy轴⽅向,矩阵不同纬度代表含义)。 4.针对图像⼏种算术运算,任选两种写出具体应⽤场景。 5.针对图像⼏种逻辑运算,任选两种写出具体应⽤场景。 设计要求为上述内容,用python实现,给出代码
首先,用户提到的实验内容有九项,从熟悉编程环境到设计题提取立方体。算法设计部分有五个问题,涉及图像存储形式、批量处理、坐标分析、算术和逻辑运算的应用场景。用户希望用Python实现这些功能,并得到代码。
我需要考虑使用哪些Python库。显然,OpenCV和PIL是处理图像读取、显示、保存的关键库。此外,matplotlib用于显示图像和绘制子图,numpy处理数组运算。对于文件操作,os模块可以帮助批量读取文件夹中的图像文件。
接下来,实验内容1到3可能需要使用cv2.imread读取图像,cv2.imshow显示,但考虑到Jupyter环境,可能用matplotlib来显示更好。保存图像用cv2.imwrite。批量处理的话,可以用os.listdir遍历文件夹,读取所有图像。
实验内容4是截取图像区域,这可以通过数组切片实现,例如image[y_start:y_end, x_start:x_end],但要注意OpenCV中坐标的顺序是先行后列,即高度在前,宽度在后,所以可能需要调整坐标范围。
实验5是幂次变换,即伽马校正。公式是output = c * (input ^ gamma),需要将图像归一化到0-1之间,应用变换后再还原。这里要注意数据类型转换,避免溢出。
实验6的算术运算:加、减、点乘、缩放、旋转。加和减可以用cv2.add和cv2.subtract,点乘是逐个元素相乘,缩放可以用cv2.resize,旋转用cv2.rotate或cv2.getRotationMatrix2D。需要注意的是,缩放和旋转可能会改变图像尺寸,需要处理。
实验7的逻辑运算:与、或、非、异或。这些在OpenCV中对应的函数是cv2.bitwise_and, or, not, xor。需要确保图像是二值化的,或者转换为二进制形式,不过对于灰度图像,可能按位操作。
实验8是绘制子图,使用matplotlib的subplots来创建多个子图,显示原图和各处理结果。
实验9的设计题,提取立方体。可能的方法包括颜色分割(立方体可能有特定颜色范围),或者边缘检测找立方体的轮廓。需要用户提供的图像具体分析,但这里需要给出两种方法的大致思路。
算法设计问题1:图像在内存中的存储形式。彩色图像通常是三维数组,高度×宽度×通道(BGR),数据类型是uint8。需要解释OpenCV的默认读取方式。
问题2:批量读取图像,调用函数处理,保存结果。需要在主函数中循环读取,应用每个运算函数,保存结果。可能每个运算生成不同的输出文件。
问题3:坐标分布分析。需要指出在图像处理中,原点通常在左上角,x轴向右,y轴向下。矩阵的维度是(行,列,通道),即(y, x, channels)。
问题4和5:算术和逻辑运算的应用场景。比如加法用于图像叠加,减法用于变化检测;逻辑与用于掩膜应用,异或用于变化检测。
现在,开始组织代码结构。首先导入必要的库:cv2, numpy, matplotlib, os, glob等。然后定义各个函数,对应实验内容中的每个步骤。例如,函数gamma_transform处理幂次变换,arithmetic_operations处理加减等。
需要注意的问题:
- 图像读取时,OpenCV默认是BGR格式,显示时可能需要转换为RGB。
- 处理批量图像时,确保所有图像大小相同,否则运算可能出错。
- 保存图像时路径要正确,避免覆盖原文件。
- 伽马变换时,将图像转换为float类型,进行归一化,再应用幂次,最后转换回uint8。
- 逻辑运算可能需要将图像二值化,或者确保在相同尺寸下操作。
- 子图布局要合理,可能需要调整figsize和子图排列。
可能遇到的错误:
- 路径错误,导致图像无法读取或保存。
- 数组维度不匹配,特别是在算术运算时。
- 数据类型未转换,导致计算错误或溢出。
- 坐标范围超出图像尺寸,导致切片错误。
测试每个函数的功能是否正确,例如测试伽马变换是否改变了图像的亮度分布,缩放是否正确应用,旋转方向是否正确等。
对于设计题,假设图像中的立方体有显著的颜色或边缘特征。方法一可以是颜色阈值分割,选取立方体的颜色范围进行二值化,提取区域。方法二可以是边缘检测(Canny)后寻找轮廓,选择符合立方体形状的轮廓。
最后,整合所有代码,确保每个步骤都被涵盖,函数定义正确,主程序部分调用这些函数并生成所需结果。添加必要的注释,帮助用户理解代码逻辑。我将根据实验内容分步骤提供Python实现代码及关键分析。以下是综合解决方案:
import cv2
import numpy as np
import matplotlib.pyplot as plt
import os
from glob import glob
# ======== 实验内容实现 ========
# 实验2-3:图像读写(批量处理)
def batch_image_processing(input_dir, output_dir):
os.makedirs(output_dir, exist_ok=True)
images = []
for img_path in glob(os.path.join(input_dir, "*.*")):
img = cv2.imread(img_path)
if img is not None:
images.append(img)
cv2.imwrite(os.path.join(output_dir, os.path.basename(img_path)), img)
return images
# 实验4:区域截取
def crop_image(img, x_range, y_range):
return img[y_range[0]:y_range[1], x_range[0]:x_range[1]]
# 实验5:幂次变换
def gamma_transform(img, c=1, gamma=3):
img_float = img.astype(np.float32) / 255.0
transformed = c * np.power(img_float, gamma)
return (transformed * 255).astype(np.uint8)
# 实验6:算术运算
def arithmetic_operations(img1, img2):
add = cv2.add(img1, img2)
sub = cv2.subtract(img1, img2)
mul = cv2.multiply(img1, img2)
# 缩放
scale2x = cv2.resize(img1, None, fx=2, fy=2, interpolation=cv2.INTER_LINEAR)
scale05x = cv2.resize(img1, None, fx=0.5, fy=0.5, interpolation=cv2.INTER_AREA)
# 旋转
rot90 = cv2.rotate(img1, cv2.ROTATE_90_CLOCKWISE)
rot180 = cv2.rotate(img1, cv2.ROTATE_180)
return add, sub, mul, scale2x, scale05x, rot90, rot180
# 实验7:逻辑运算
def logic_operations(img1, img2):
and_img = cv2.bitwise_and(img1, img2)
or_img = cv2.bitwise_or(img1, img2)
not_img = cv2.bitwise_not(img1)
xor_img = cv2.bitwise_xor(img1, img2)
return and_img, or_img, not_img, xor_img
# 实验8:子图展示
def show_subplots(results):
plt.figure(figsize=(20, 10))
titles = ['Original', 'Cropped', 'Gamma', 'Add', 'Subtract', 'Multiply', 'AND', 'OR', 'NOT', 'XOR']
for i in range(len(results)):
plt.subplot(2, 5, i+1)
plt.imshow(cv2.cvtColor(results[i], cv2.COLOR_BGR2RGB))
plt.title(titles[i])
plt.tight_layout()
plt.show()
# 实验9:立方体提取(示例方法)
def extract_cube_method1(img):
# 方法1:颜色阈值分割
hsv = cv2.cvtColor(img, cv2.COLOR_BGR2HSV)
lower = np.array([0, 100, 100])
upper = np.array([10, 255, 255])
mask = cv2.inRange(hsv, lower, upper)
return cv2.bitwise_and(img, img, mask=mask)
def extract_cube_method2(img):
# 方法2:边缘检测+轮廓提取
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
edges = cv2.Canny(gray, 100, 200)
contours, _ = cv2.findContours(edges, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
result = img.copy()
cv2.drawContours(result, [max(contours, key=cv2.contourArea)], -1, (0,255,0), 2)
return result
# ======== 主程序 ========
if __name__ == "__main__":
# 读取示例图像
img = cv2.imread("1-1.png")
# 实验4执行
cropped = crop_image(img, [100,200], [100,250])
# 实验5执行
gamma_img = gamma_transform(img, gamma=3)
# 实验6执行(需要第二张图)
img2 = cv2.imread("1-2.png")
add, sub, mul, *_ = arithmetic_operations(img, img2)
# 实验7执行
and_img, or_img, not_img, xor_img = logic_operations(img, img2)
# 结果汇总
results = [img, cropped, gamma_img, add, sub, mul, and_img, or_img, not_img, xor_img]
# 实验8执行
show_subplots(results)
# 批量处理示例
batch_image_processing("input_folder", "output_folder")
算法设计问题解答
1. 彩色图像存储形式
在OpenCV中,640×480彩色图像存储为三维ndarray
数组,维度为(480, 640, 3)
(高×宽×通道),数据类型为uint8
。通道顺序为BGR排列。
2. 批量处理实现要点
def batch_process(input_dir):
images = []
for path in glob(os.path.join(input_dir, "*.png")):
img = cv2.imread(path)
if img is not None:
images.append(img)
results = []
for img in images:
# 调用各运算函数
gamma = gamma_transform(img)
add = cv2.add(img, images[0])
# ...其他运算
results.extend([gamma, add])
for i, res in enumerate(results):
cv2.imwrite(f"result_{i}.png", res)
3. 坐标分布分析
- 原点位置:图像左上角(0,0)
- X轴方向:水平向右
- Y轴方向:垂直向下
- 矩阵维度:
img[y, x, channel]
,第一维为垂直方向,第二维为水平方向
4. 算术运算应用场景
- 加法:多帧降噪、图像融合
- 减法:运动检测、背景消除
5. 逻辑运算应用场景
- 与运算:掩模应用、感兴趣区域提取
- 异或运算:变化检测、数字水印验证
关键说明
环境要求:
pip install opencv-python numpy matplotlib
路径处理建议使用绝对路径,确保文件权限正确
伽马变换时需要注意:
# 防止数值溢出的更安全实现 def gamma_transform(img, c=1, gamma=3): table = np.array([c * ((i / 255.0) ** gamma) * 255 for i in np.arange(0, 256)]).astype("uint8") return cv2.LUT(img, table)
对于图像旋转的通用实现:
def rotate_image(img, angle): h, w = img.shape[:2] M = cv2.getRotationMatrix2D((w/2,h/2), angle, 1) return cv2.warpAffine(img, M, (w,h))
相关推荐

















