目标检测数据集半自动生成:速度与精度提升

需积分: 14 1 下载量 145 浏览量 更新于2024-08-13 收藏 1.19MB PDF 举报
目标检测数据集半自动生成技术研究是一篇关注计算机视觉领域的重要论文,由孙晓璇、张磊和李健三位作者合作完成,发表于2019年的《计算机系统应用》杂志。随着目标检测在自动驾驶、安防监控等众多应用场景中的广泛应用,大量的标注数据是训练高效模型的关键。然而,手动创建和标注目标检测数据集是一项繁琐且耗时的工作,特别是在大规模数据集上。 本文提出了一种创新的半自动化方法,主要聚焦于YOLOv3(You Only Look Once,第三代)和SSD(Single Shot MultiBox Detector,单次多框检测器)两种流行的深度学习目标检测算法。作者利用了差异值哈希(Difference Hashing)技术,这是一种有效的图像特征表示方法,能够快速比较图像间的相似性。通过这种方式,他们设计了一个流程:首先,使用机器学习技术自动生成初步的图像标签,这些标签并非完全准确,但能提供一定的指导。 接着,作者设置一个图像相似度阈值,对自动生成的标签进行筛选。这个阈值的设定旨在平衡精度和效率,只保留那些在视觉上足够相似且能正确反映目标对象的图像。这样,通过自动筛选,可以大大提高数据集标签的生成速度,减少人工审核的工作量,同时尽可能保持了标签的准确性。 实验结果表明,这种方法显著提升了数据集创建的效率,对于大规模目标检测任务来说具有明显的优势。它不仅减少了人力成本,而且在保证模型训练质量的前提下,使得研究人员可以更专注于算法优化和模型性能提升。 这篇研究为解决目标检测领域数据集标注难题提供了新的解决方案,对于实际应用和进一步的自动化研究具有重要意义。如果需要引用这项工作,应当遵循给出的引用格式:孙晓璇, 张磊, 李健. 目标检测数据集半自动生成技术研究. 计算机系统应用, 2019, 28(10): 8-14. <http://www.c-s-a.org.cn/1003-3254/7101.html>。