深度度量学习新法:LoOp优化训练,提升性能

0 下载量 109 浏览量 更新于2024-06-20 收藏 742KB PDF 举报
深度度量学习是一种关键的机器学习技术,它聚焦于构建深度神经网络,以便在嵌入空间中捕捉和表示数据样本之间的语义相似性。这种技术在诸如图像检索、人脸识别、重新识别等任务中表现出色,已经成为最先进的解决方案。传统的深度度量学习方法通常依赖于特定的损失函数,比如对比损失(涉及两样本对)和三重损失(考虑三个样本元组),它们试图通过比较样本间的相似性来指导网络训练。 然而,现有方法存在局限性。一是硬挖掘策略可能导致有偏的嵌入,因为它们倾向于选择信息量最大但可能不全面的样本进行训练,这可能导致模型对某些类别的理解不足。二是这些方法可能面临优化难度增加和训练速度变慢的问题。三是附加网络生成硬合成物的方法增加了模型的复杂性。 为了解决这些问题,本文提出了一种创新的硬否定(LoOp)方法。LoOp的目标是在嵌入空间中寻找最佳的负样本对,通过计算阳性和阴性样本之间的最小距离,从而最大化每个元组的信息利用。与基于挖掘的方法不同,LoOp不仅关注单个样本对,而是考虑整个嵌入对的空间,这意味着它能够更好地捕捉全局关系,提供更全面的训练信息。 相比于传统的损失函数,LoOp方法利用所有批次中的样本信息,特别是那些对损失函数约束不满足的“弱”样本,通过它们提供梯度更新,从而改善模型的泛化能力和性能。这种方法的优势在于其能够提升训练效率,减少有偏嵌入的风险,并降低模型复杂度。 LoOp的核心思想体现在图1所示的直观图示中,通过计算连接不同类别嵌入点的曲线之间的最小距离,网络学习到一个更加均衡且丰富的嵌入空间。在实际应用中,研究人员已将LoOp的代码开源(<https://github.com/puneesh00/LoOp>),便于其他研究者进一步研究和改进深度度量学习。 通过广泛的实验验证,LoOp在包括三个基准数据集在内的多个深度度量学习任务中展现了显著的性能提升,表明这是一种有前景的改进策略,值得深入探索和在实际场景中广泛应用。

帮我降重:针对上述问题,另一种方法考虑到空中交通复杂性是一系列复杂性因素之间相互作用的结果,因此许多学者通过综合多个紧密相关的因素来产生更全面的复杂性度量指标,结合机器学习技术来计算复杂性,并取得了一些令人满意的效果[94,95]。然而,基于机器学习的方法非常依赖所构建的特征集,这可能需要根据复杂性因素进行更多的特征选择或特征构造的工作。因此,最新的研究使用深度学习方法来自动提取原始数据的高级语义特征。谢等人[96]于2021年首次提出了一种扇区运行场景的图像表示法,进而结合深度学习技术提出了一种基于深度卷积神经网络(DCNN)的SOC评估方法,有效地提高了SOC评估的准确性。这种新的扇区运行场景信息的图像表示方法,为SOC评估方法的发展打开了新思路,使得在图像处理领域表现出色的多种深度学习技术,可以用于解决SOC评估问题。 受此启发,本章节尝试利用深度度量学习方法在联合学习特征表示和语义嵌入方面的优势,提出了一种基于深度度量学习的SOC评估方法(SOCDML)。该方法以多通道空中交通场景图像(Multi-channels Air Traffic Scenario Image,MTSI)[96]作为输入,首先利用DCNN提取扇区交通信息相关的深层特征。然后,设计了一种基于排序代理锚损失的深度度量学习算法,并用该算法对所提取原始数据的嵌入向量进行度量,使具有相似交通场景的嵌入向量之间的距离变小,而不同嵌入向量之间的距离变大。最后将提取到的嵌入向量作为后续1NN分类算法的输入,实现SOC评估。

2023-02-21 上传