SIXray:大规模安检X射线图像违禁品检测基准与挑战

0 下载量 31 浏览量 更新于2025-01-16 收藏 1.41MB PDF 举报
"SIXray是一个大规模的安检X射线图像数据集,专注于违禁品检测,由1,059,231张图像组成,涵盖了6大类8,929个违禁物品的手动标注。这个数据集特别强调了重叠图像的挑战,同时具备复杂背景和类别不平衡的问题。" 在当前的研究中,SIXray数据集的提出旨在推动安检X射线图像分析技术的发展。由于公共场所的安全需求日益增加,快速、精准地识别X射线图像中的违禁品变得至关重要。传统的机器学习方法,如支持向量机(SVM),在处理此类任务时可能遇到局限,尤其是在复杂的背景和重叠物体的情况下。 深度学习,尤其是卷积神经网络(CNN),为解决这一问题提供了新的可能。然而,CNN在处理SIXray这类数据时,需要应对两个主要挑战:一是图像中的对象可能存在大量重叠,二是类别之间的不平衡。为了解决这些问题,研究者提出了一种类平衡的高精度反向连接精细化(Class-Balanced High-Precision Back-Connection Refinement, CBHPR)算法。 CBHPR算法假设每个输入图像都来自一个混合分布,深度网络需要通过迭代过程来准确解析图像内容。通过在不同的网络主干中插入反向连接,该方法能够提供高级视觉提示,帮助中间层功能更好地理解图像。此外,设计了一种类平衡损失函数,以减少易于引入噪声的负样本的影响。 通过对SIXray数据集进行不同阳性/阴性样本比例的评估,研究发现CBHPR算法在处理类别不平衡问题上表现出色,尤其在正样本较少的情况下,神经网络相比于SVM有显著优势。这表明神经网络在实际安全检测场景中有巨大的潜力。 1.1 引言部分还提到,随着城市人口增长和交通节点的密集,安全检查的需求持续增加。X射线图像分析技术的进步将有助于提升公共安全,自动化和精确化的违禁品检测对于防范恐怖主义等威胁至关重要。因此,SIXray数据集的发布和相关算法的开发,为科研人员提供了一个强大的工具,以进一步提升安检系统的效能。