使用预训练权重训练YOLO：解决数据集类别差异

需积分: 0 155 浏览量更新于2024-08-04 收藏 285KB DOCX 举报

"该资源主要讲述了如何利用预训练的YOLO模型进行自定义数据集的训练和预测，以及相关的数据准备步骤。" 在训练自定义数据集时，通常会利用预训练模型进行迁移学习，以提高模型的泛化能力。YOLO（You Only Look Once）是一种流行的实时目标检测算法，它在COCO数据集上预先训练的权重可以用于其他任务。COCO数据集包含80个类别，而如果你的数据集类别不同或较少，例如VOC数据集的20个类别，依然可以使用这些权重。关键在于理解如何适配模型以适应新数据集的类别。在`yolo.py`文件中，预训练权重是基于COCO数据集的，因此预测时需要指向`coco_classes.txt`，列出COCO的80个类别。如果你想预测VOC数据集的类别，你需要修改代码，确保类别判定条件只针对VOC的20个类别。值得注意的是，尽管VOC类别的子集在COCO中存在，但直接使用`voc_classes.txt`会导致错误。加载预训练权重时，只需关注最后输出的三个特征图的通道数，因为这与数据集中类别的数量直接相关。其余部分的网络结构可以通用，因此可以使用以下方式加载匹配的权重： ```python # 假设你有80类的预训练权重，但你的数据集只有20类 num_classes = 20 # 自定义数据集的类别数 model.load_state_dict(torch.load('pretrained_weights.pth'), strict=False) ``` 在开始训练前，需要对数据集进行一系列的准备工作。首先，删除旧的训练记录，包括`logs`文件夹中的权重和日志文件，以及`VOCdevkit/VOC2007/ImageSets/Main`文件夹下的训练和验证列表文件。此外，还要清空`map_out`文件夹，因为它保存了上一次测试的结果。数据集的标签必须是VOC格式的XML文件，图片应为jpg格式。如果标签是其他格式，如COCO的json，需要转换为VOC格式。同样，如果图片是其他格式，也可以通过脚本转换为jpg。例如，你可以使用`F盘的DataSet_VOC/convert_img.py`来完成此操作。将制作好的数据集图片放入`VOCdevkit\VOC2007\JPEGImages`文件夹，标签XML文件放入`Annotations`文件夹。然后，在`model_data`文件夹下创建一个新的txt文件，如`my_classes.txt`，列出你的数据集类别，每行一个类别。最后，可能需要修改`voc_anotations.py`文件以适应你的数据集处理逻辑。这个文件通常包含了处理VOC格式标注的函数，确保它们正确地映射到你的类别列表。这个资源提供了使用YOLO模型进行自定义数据集训练的详细步骤，包括数据准备、预训练权重的利用以及必要的代码调整。通过遵循这些步骤，你可以有效地将YOLO模型应用于新的目标检测任务。

yolo.py 这个文件是与训练完之后进行预测用的，与训练过程无关。于是当下载了代码和

预训练权重之后，由于预训练权重是在 coco 数据集上训练出来的，于是 yolo.py 里面的

所要去预测的类别的 txt 文件只能指向 coco_classes.txt。虽然 voc 数据集（20 个类）里

面的类在 coco 数据集（80 个类）里面都有，但是如果修改为 voc_classes.txt 就会报错。

载入预训练权重可以预测 voc 里面没有但是 coco 里有的类，比如 umbrella。（如果只想

预测 voc 里面的类，请在代码里面修改，加上类别判定条件即可。）

关于使用预训练权重，比如使用 coco 训练出来的 YOLO 权重，coco 有 80 各类，而自己

的数据集不是 80 各类，其实只有最后输出的三个特征图在通道数上有区别，其他任何

地方都没有区别，所以加载的时候可以通过下面的代码加载匹配的权重：

所以，如果采用迁移学习去训练的话，不管是自己的数据集还是 voc2007+2012 数据集，

首先下载代码与预训练权重（注：如果修改了网络结构的话就没办法用预训练权重

了），参照以下步骤：

（前提要求：标签必须是 VOC 格式的，即 XML 文件。图片必须是 jpg 格式的。Coco 数

据集是 json 格式的标签，可以用程序转成 voc 格式。其他格式的图片也能转为 jpg 格式）

1. 首先删除一些东西：

（1）logs 文件夹下所有权重和日志文件

（2）VOCdevkit/VOC2007/ImageSets/Main 文件夹下的四个 txt 文件

（3）2007_train.txt 和 2007_val.txt 文件

下载后可阅读完整内容，剩余5页未读，立即下载

曹将

粉丝: 23
资源: 308

使用预训练权重训练YOLO：解决数据集类别差异

yolov8训练自己的数据集（源码）.rar

图像处理去雨训练数据集

darknet训练自己数据集

mmdection 训练自己数据集

yolo nas训练自己数据集

detr训练自己数据集

paddlepaddle训练自己数据集

mmdetection训练自己数据集

maskcnn 训练自己数据集

segmenter训练自己数据集

最新资源