利用YOLOV5训练自动驾驶数据集并转换为TensorRT实战

92 浏览量更新于2024-08-03 1 收藏 1.37MB PDF 举报

本文主要介绍了如何使用YOLOV5进行自动驾驶数据集的训练和优化，以及将其转换为TensorRT的过程。首先，作者提到了BDD100K数据集，这是自动驾驶领域的一个重要资源，包含了大量高分辨率视频和丰富的场景，用于评估和训练自动驾驶算法。这个数据集的特点在于其地理、环境和天气多样性，有助于模型在各种复杂条件下进行准确的物体检测和理解。为了进行训练，YOLOV5的数据格式要求与标注文件紧密配合。每个图片文件需要有对应的标签文件，标签以JSON格式表示，包含对象类别、类别编号、相对于图片尺寸的比例位置等信息。YOLOV5的标签格式强调了中心点而不是左上角坐标，并且每个对象占据一行。由于BDD100K的标签并非直接符合YOLOV5的需求，作者建议通过两个步骤转换：首先使用berkeley提供的工具将BDD100K的标签转换为COCO格式，这是一种广泛使用的通用对象检测数据格式；然后，再利用COCO格式的标签将数据转化为YOLOV5所需的标签格式。转换为YOLO格式后，可以使用YOLOV5进行训练，这是一个轻量级的实时物体检测模型，以其高效性和准确性而受到欢迎。训练完成后，将模型部署到实际应用中的一个关键步骤是将其优化为TensorRT，这是一个由NVIDIA开发的高性能深度学习推理优化器。通过TensorRT，模型能够在硬件加速器如GPU上运行得更快，这对于实时自动驾驶系统来说至关重要。整个流程包括数据预处理、环境配置（可能涉及到安装必要的软件和库）、配置文件修改以适应YOLOV5和BDD100K数据集，以及模型的训练、推理和最后的TensorRT转换。通过这样的步骤，开发者可以利用强大的YOLOV5框架和高效的TensorRT技术，提升自动驾驶系统的性能和可靠性。

for label in i['labels']: annotation = dict() category=label['category'] if (category == "traffic light"): color = label['attributes']['trafficLightColor'] category = "tl_" + color if category in id_dict.keys(): empty_image = False annotation["iscrowd"] = 0 annotation["image_id"] = image['id'] x1 = label['box2d']['x1'] y1 = label['box2d']['y1'] x2 = label['box2d']['x2'] y2 = label['box2d']['y2'] annotation['bbox'] = [x1, y1, x2-x1, y2-y1] annotation['area'] = float((x2 - x1) * (y2 - y1)) annotation['category_id'] = id_dict[category] annotation['ignore'] = 0 annotation['id'] = label['id'] annotation['segmentation'] = [[x1, y1, x1, y2, x2, y2, x2, y1]] annotations.append(annotation)

在完成bdd100k格式到yolo格式的转换后，会获

得bdd100k_labels_images_det_coco_train.json和bdd100k_labels_images_det_coco_val.json两个⽂件。

Coco to yolo

在完成先前的转换之后，我们需要将训练集和验证集的coco格式标签转换为yolo格式。注意需要分别指定训练集和验证集图⽚位置，对应

的coco标签⽂件位置，及⽣成yolo标签的⽬标位置。

config_train ={ "datasets": "COCO", "img_path": "bdd100k_images/bdd100k/images/100k/train", "label": "labels/bdd100k_labels_images_det_coco_train.json", "img_type": ".jpg", "manipast_path": "./", "output_path": "labels/trains/", "cls_list": "bdd100k.names", } config_valid ={

除此之外，我们还得将所有的类别写⼊bdd100k.names⽂件。