Yolov3中使用的nms函数如何使用

在 YOLOv3 中，nms 函数用于过滤检测结果中的重叠框，保留置信度最高的框。nms 函数的具体实现可以参考以下代码： ```python def non_max_suppression(prediction, confidence, num_classes, nms_conf=0.4): """ 使用非极大值抑制过滤检测结果中的重叠框 """ # 获取所有检测框的左上角和右下角坐标 box_corner = prediction.new(prediction.shape) box_corner[:, :, 0] = prediction[:, :, 0] - prediction[:, :, 2] / 2 box_corner[:, :, 1] = prediction[:, :, 1] - prediction[:, :, 3] / 2 box_corner[:, :, 2] = prediction[:, :, 0] + prediction[:, :, 2] / 2 box_corner[:, :, 3] = prediction[:, :, 1] + prediction[:, :, 3] / 2 prediction[:, :, :4] = box_corner[:, :, :4] output = [None for _ in range(len(prediction))] # 对每个图片的检测结果进行处理 for image_i, image_pred in enumerate(prediction): # 获取该图片中置信度最高的类别 max_conf, max_conf_idx = torch.max(image_pred[:, 5:5 + num_classes], 1) max_conf = max_conf.float().unsqueeze(1) max_conf_idx = max_conf_idx.float().unsqueeze(1) # 将置信度最高的类别和置信度分数合并到一起 seq = (image_pred[:, :5], max_conf, max_conf_idx) image_pred = torch.cat(seq, 1) # 删除置信度小于阈值的框 non_zero_indices = (torch.nonzero(image_pred[:, 4])) try: image_pred_ = image_pred[non_zero_indices.squeeze(), :].view(-1, 7) except: continue # 获取所有检测框的面积 img_classes = unique(image_pred_[:, -1]) for cls in img_classes: # 获取该类别的检测结果 cls_mask = image_pred_ * (image_pred_[:, -1] == cls).float().unsqueeze(1) class_mask_idx = torch.nonzero(cls_mask[:, -2]).squeeze() image_pred_class = image_pred_[class_mask_idx].view(-1, 7) # 按照置信度排序 conf_sort_index = torch.sort(image_pred_class[:, 4], descending=True)[1] image_pred_class = image_pred_class[conf_sort_index] idx = image_pred_class.size(0) # 检测框的数量 for i in range(idx): # 计算当前检测框与其它检测框的 IoU try: ious = bbox_iou(image_pred_class[i].unsqueeze(0), image_pred_class[i + 1:]) except ValueError: break except IndexError: break # 将 IoU 大于阈值的检测框删除 iou_mask = (ious < nms_conf).float().unsqueeze(1) image_pred_class[i + 1:] *= iou_mask non_zero_indices = torch.nonzero(image_pred_class[:, 4]).squeeze() image_pred_class = image_pred_class[non_zero_indices].view(-1, 7) batch_index = image_pred_class.new(image_pred_class.size(0), 1).fill_(image_i) # 将图片索引加入到检测框中 seq = batch_index, image_pred_class if not output[image_i]: output[image_i] = torch.cat(seq, 1) else: output[image_i] = torch.cat((output[image_i], torch.cat(seq, 1))) return output ``` 其中，bbox_iou 函数用于计算两个框的 IoU 值，unique 函数用于获取一个张量中的所有唯一值。使用时，可以将预测结果和对应的置信度输入到 non_max_suppression 函数中进行处理，如下所示： ```python # 获取预测结果和置信度 prediction = model(x) conf_mask = (prediction[:, :, 4] > confidence_threshold).float().unsqueeze(2) prediction = prediction * conf_mask # 过滤掉重叠的检测框 output = non_max_suppression(prediction, confidence_threshold, num_classes) ```

阅读全文

Yolov3中使用的nms函数如何使用

相关推荐

yolov3算法使用教程

yolo-tensorrt:支持Yolov5s，m，l，x .darknet->张量。 Yolov4 Yolov3使用原始暗网* .weights和* .cfg fils。 如果包装纸对您有用，请加注星标

基于yolov3的人体手势检测代码

yolov3进行nms的函数

yolov5中如何查看NMS函数

YOLOv8中的NMS(非极大值抑制)算法原理及应用

【优化算法对比】：YOLOv8中NMS与Soft-NMS的深入比较

yolov8 soft-nms

yolov5多类别nms

YOLOv8 CIoU-NMS

yolov5如何更改nms阈值

yolov7如何使用softNMS

yolov5如何使用diou nms

yolov8改进NMS

yolov5修改nms

yolov8softnms

yolov8改进nms

yolov5改进NMS

yolov7修改nms

YOLOv8 自适应NMS

大家在看

libomp140.x86-64.dll

多文档应用程序MDI-vc++、MFC基础教程

遥感图像处理教程，以ENVI为例，仅供参考。

amd主板现代待机规范S0i3

ADS函数大全

最新推荐

pycharm下python使用yolov3/yolov3-tiny训练好的权重文件.weights进行行人检测，批量测试自定义文件夹下的图片并输出至指定文件夹

基于springboot+vue的体育馆管理系统的设计与实现（Java毕业设计，附源码，部署教程）.zip

探索zinoucha-master中的0101000101奥秘

【Qt与OpenGL集成】：提升框选功能图形性能，OpenGL的高效应用案例

ffmpeg 指定屏幕输出

个人网站技术深度解析：Haskell构建、黑暗主题、并行化等

Qt框选功能的国际化实践：支持多语言界面的核心技术解析

内网如何运行docker pull mysql:5.7

ImgToString开源工具：图像转字符串轻松实现

Qt框选功能安全性增强指南：防止恶意操作的有效策略

yolo-tensorrt:支持Yolov5s，m，l，x .darknet->张量。 Yolov4 Yolov3使用原始暗网* .weights和* .cfg fils。如果包装纸对您有用，请加注星标