驾驶场景行为检测9884张图片VOC+YOLO数据集发布

版权申诉
0 下载量 132 浏览量 更新于2024-10-30 3 收藏 213.85MB 7Z 举报
数据集主要关注的是驾驶员在驾驶过程中可能出现的五种危险行为:抽烟、闭眼、睁眼、打电话和未系安全带。每张图片都有一个对应的VOC格式的xml文件和一个YOLO格式的txt文件,共9884对标注文件,标注了共23389个目标框。 Pascal VOC格式是一个广泛使用的图像标注格式,用于目标检测、分类和分割任务。它包含了图像的详细信息,如尺寸、对象的类别、边界框的位置(即对象的左上角和右下角坐标)以及可能的分割掩码。VOC格式的标注文件通常用于机器学习和计算机视觉模型的训练,尤其在自动驾驶和交通监控领域。 YOLO(You Only Look Once)是一个流行的目标检测算法,它将目标检测任务视为一个回归问题。YOLO算法将输入图像划分为一个个格子,并为每个格子预测边界框和概率。YOLO格式的标注文件通常包含图像中每个目标的类别标签以及边界框的中心坐标和宽高。YOLO格式以其简洁性和实时性著称,在工业界得到了广泛应用。 本数据集使用了labelImg工具进行图像标注,该工具是一个开源的图像标注软件,广泛用于机器学习和计算机视觉领域,支持Pascal VOC和YOLO等多种格式的标注,方便研究者和开发人员对数据集进行准备。 每个类别的标注框数分别列出,例如: - 抽烟(cigarette):3907个标注框 - 闭眼(closeeye):1603个标注框 - 睁眼(openeye):11178个标注框 - 打电话(phone):2552个标注框 - 未系安全带(seatbelt):4149个标注框 数据集不包含对训练模型或权重文件精度的任何保证,但它提供了准确和合理的标注,供用户在进行目标检测、行为识别等研究和开发任务时使用。 更多关于本数据集的详细信息和讨论,可以参考提供的博客链接:***/FL***/article/details/***。"