pascal voc转yolo

### 转换过程概述为了将Pascal VOC格式的数据集转换为YOLO格式，主要涉及文件结构调整以及标注文件内容的转换。具体来说，VOC格式中的每张图片对应一个XML文件，而YOLO格式则采用TXT文件记录目标框信息，并且这些坐标是以相对位置表示的。 #### 文件结构调整在开始转换之前，确保原始图像和对应的标签文件按照一定规则组织好。对于YOLO格式而言，通常期望看到如下目录结构： ``` dataset/ ├── images/ │ ├── img1.jpg │ └── ... └── labels/ ├── img1.txt └── ... ``` #### XML到TXT的转换逻辑从VOC至YOLO的关键在于解析XML文档内的边界框数据，并将其转化为YOLO所需的标准化形式——即中心点(x_center, y_center)，宽度(width) 和高度(height)，所有数值均为相对于整幅图尺寸的比例值[^1]。以下是实现上述功能的一段Python代码示例: ```python import xml.etree.ElementTree as ET from os import getcwd sets=[('2007', 'train'), ('2007', 'val')] classes = ["aeroplane", "bicycle", "bird"] # 需要根据实际情况修改类别列表 def convert(size, box): dw = 1./(size[0]) dh = 1./(size[1]) x = (box[0] + box[1])/2.0 - 1 y = (box[2] + box[3])/2.0 - 1 w = box[1] - box[0] h = box[3] - box[2] x = x*dw w = w*dw y = y*dh h = h*dh return (x,y,w,h) def convert_annotation(year, image_id, list_file): in_file = open(f'./VOCdevkit/VOC{year}/Annotations/{image_id}.xml') out_file = open(f'./labels/{image_id}.txt', 'w') tree=ET.parse(in_file) root = tree.getroot() size = root.find('size') w = int(size.find('width').text) h = int(size.find('height').text) for obj in root.iter('object'): difficult = obj.find('difficult').text cls = obj.find('name').text if cls not in classes or int(difficult)==1: continue cls_id = classes.index(cls) xmlbox = obj.find('bndbox') b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text)) bb = convert((w,h), b) out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n') wd = getcwd() for year, image_set in sets: image_ids = open(f'./VOCdevkit/VOC{year}/ImageSets/Main/{image_set}.txt').read().strip().split() list_file = open('%s_%s.txt'%(year, image_set), 'w') for image_id in image_ids: list_file.write(f'{wd}/images/{image_id}.jpg\n') convert_annotation(year, image_id, list_file) list_file.close() ``` 此脚本遍历指定年份下的训练/验证集合，读取相应的XML文件并创建匹配的TXT文件用于存储转换后的YOLO风格的目标检测标记信息。

阅读全文

相关推荐

基于python实现voc转yolo格式voc转coco格式源码+项目说明.zip

YOLO格式转换成VOC格式

VOC2007数据集YOLO格式

猪类别Pascal VOC和YOLO格式数据集

Pascal VOC与YOLO格式垃圾检测数据集

Pascal VOC及YOLO格式脑瘤检测数据集

Pascal VOC与YOLO格式小麦检测数据集发布

Pascal VOC与YOLO格式车辆检测数据集下载

Pascal VOC & YOLO格式蟹类数据集压缩包

Pascal VOC与YOLO格式的绳子检测数据集

Pascal VOC和YOLO格式的烟雾检测数据集

手扶电梯缺陷检测Pascal VOC+YOLO格式数据集

Pascal VOC与YOLO格式轴承缺陷划痕检测数据集

Pascal VOC与YOLO格式的齿轮检测数据集详情

8144张Pascal VOC+YOLO格式车辆检测数据集

野猪家猪检测数据集：Pascal VOC+YOLO格式

Pascal VOC及YOLO格式烟雾明火检测数据集发布

8097张图片的Pascal VOC和YOLO标注数据集

Pascal VOC和YOLO格式的螺丝缺陷检测数据集

Pascal VOC和YOLO格式的蜗牛图像标注数据集

大家在看

TwinSAFE EL6900 安全模块基础使用指南（针对TC3.1.4020.0版本）.pdf

mike21建模

MAX 10 FPGA模数转换器用户指南

黑金ALINX Zynq UltraScale+MPSoC开发平台ACU19EG 核心板原理图

ASML_Reticle_manual_Final_2007

最新推荐

036GraphTheory(图论) matlab代码.rar

026SVM用于分类时的参数优化，粒子群优化算法，用于优化核函数的c,g两个参数(SVM PSO)Matlab代码.rar

macOS 10.9至10.13版高通RTL88xx USB驱动下载

PyCharm开发者必备：提升效率的Python环境管理秘籍

matlab中VBA指令集

在Windows Forms和WPF中实现FontAwesome-4.7.0图形

【Postman进阶秘籍】：解锁高级API测试与管理的10大技巧

ubuntu22.04怎么恢复出厂设置

2001年度广告运作规划：高效利用资源的策略

【Postman终极指南】：掌握API测试到自动化部署的全流程