scores = detection[5:] classID = np.argmax(scores) confidence = scores[classID] # 过滤低置信度值的检测结果 if confidence > filter_confidence: box = detection[0:4] * np.array([W, H, W, H]) (centerX, centerY, width, height) = box.astype("int") # 转换标记框 x = int(centerX - (width / 2)) y = int(centerY - (height / 2)) # 更新标记框、置信度值、类别列表 boxes.append([x, y, int(width), int(height)]) confidences.append(float(confidence)) classIDs.append(classID)
""" Data class containing information about the detections in a video frame. Attributes: xyxy (np.ndarray): An array of shape `(n, 4)` containing the bounding boxes coordinates in format `[x1, y1, x2, y2]` mask: (Optional[np.ndarray]): An array of shape `(n, W, H)` containing the segmentation masks. confidence (Optional[np.ndarray]): An array of shape `(n,)` containing the confidence scores of the detections. class_id (Optional[np.ndarray]): An array of shape `(n,)` containing the class ids of the detections. tracker_id (Optional[np.ndarray]): An array of shape `(n,)` containing the tracker ids of the detections. """
这段代码描述了一个名为 `VideoFrameDetections` 的数据类,它包含有关视频帧中检测结果的信息。
- `xyxy`:一个形状为 `(n, 4)` 的数组,其中 `n` 是检测框的数量,包含了检测框的坐标信息,格式为 `[x1, y1, x2, y2]`。
- `mask`:可选属性,一个形状为 `(n, W, H)` 的数组,其中 `n` 是检测框的数量,`W` 和 `H` 是分割掩码的宽度和高度。它包含了分割掩码的信息。
- `confidence`:可选属性,一个形状为 `(n,)` 的数组,其中 `n` 是检测框的数量,包含了检测结果的置信度得分。
- `class_id`:可选属性,一个形状为 `(n,)` 的数组,其中 `n` 是检测框的数量,包含了检测结果的类别标签。
- `tracker_id`:可选属性,一个形状为 `(n,)` 的数组,其中 `n` 是检测框的数量,包含了检测结果的追踪器ID。
1. 下载并安装yolo8模型,可以从官方网站或Github上获取。
2. 准备测试数据集,包括图片或视频。
3. 在终端或命令行中输入命令,加载yolo8模型并对测试数据集进行测试。
4. 可以根据需要进行参数调整和优化,以获得更好的结果。
import cv2
import numpy as np
# 加载yolo8模型
net = cv2.dnn.readNet("yolo8.weights", "yolo8.cfg")
# 设置类别名称和颜色
classes = []
with open("coco.names", "r") as f:
classes = [line.strip() for line in f.readlines()]
colors = np.random.uniform(0, 255, size=(len(classes), 3))
# 加载测试数据集
img = cv2.imread("test.jpg")
height, width, channels = img.shape
# 预处理图像
blob = cv2.dnn.blobFromImage(img, 1/255.0, (416, 416), swapRB=True, crop=False)
# 设置输入和输出层
output_layers = net.getUnconnectedOutLayersNames()
# 运行模型
outputs = net.forward(output_layers)
# 解析输出
boxes = []
confidences = []
class_ids = []
for output in outputs:
for detection in output:
scores = detection[5:]
class_id = np.argmax(scores)
confidence = scores[class_id]
if confidence > 0.5:
center_x = int(detection[0] * width)
center_y = int(detection[1] * height)
w = int(detection[2] * width)
h = int(detection[3] * height)
x = center_x - w // 2
y = center_y - h // 2
boxes.append([x, y, w, h])
# 非极大值抑制
indexes = cv2.dnn.NMSBoxes(boxes, confidences, 0.5, 0.4)
# 绘制边界框和标签
for i in range(len(boxes)):
if i in indexes:
x, y, w, h = boxes[i]
label = str(classes[class_ids[i]])
color = colors[class_ids[i]]
cv2.rectangle(img, (x, y), (x + w, y + h), color, 2)
cv2.putText(img, label, (x, y - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2)
# 显示结果
cv2.imshow("Image", img)