优化F测度的显著目标检测方法

139 浏览量更新于2023-10-13 收藏 1.21MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

8849我N我优化F测度的无冗余显著目标检测赵凯1，高尚华1，王文冠2，程明明11南开大学计算机科学与工程学院2Inception Institute of Artificial Intelligence{kaiz.xyz，shanghuagao，wenguanwang.ai}@ gmail.com，cmm@nankai.edu.cn摘要当前基于CNN的显著对象检测（SOD）解决方案主要依赖于交叉熵损失（CELoss）的优化然后，检测到的显着性图的质量往往是F-测量方面进行评估。在本文中，我们研究了一个有趣的问题：我们能否在SOD的训练和评估中始终使用F-度量公式？通过重新定义标准的F测度，trieval [29]中，F度量被广泛用作任务中的评估度量，其中指定类的元素具有特别是当相关的类是罕见的。 G iv_p i x el 预测 Yi（yi∈[0，1]，i=1，.， |Y|）和真实显著性图Y（yi∈{0，1}，i=1，.，|），应用阈值t以获得二值化预测Ystect（y stect ∈ { 0，1 }，i = 1，.，|), a threshold t isappliedtoobtainthebinarizedpredictionY˙t(y˙t∈{0,1},i=1,..., |Y|）的情况。F-测度定义为查准率和查全率的调和平均值：t2精度（Y，Ystect）·召回率（Y，Ystect）我们提出了可微的松弛F-测度F（Y，Ystec（1+β）2施泰特什泰特、（1）β精度（Y，Y）+召回率（Y，Y）w.r.t的后部，可以很容易地附加到后面作为损失函数。与传统的交叉熵损失在饱和区域梯度急剧下降相比，我们的损失函数，命名为FLoss，即使当激活接近目标时，也保持相当大的梯度。因此，FLoss可以连续地迫使网络产生极化激活。在几个流行的数据集上进行的综合基准测试表明，FLoss的性能优于最先进的技术，具有相当大的优势。更具体地说，由于极化预测，我们的方法能够获得高质量的显着性图，而无需仔细调整最佳阈值，在现实世界的应用中显示出显着的优势代码和预训练模型可在www.example.com上获得http://kaizhao.net/fmeasure。1. 介绍我们认为显着的目标检测（SOD）的任务，其中一个给定的图像的每个像素被归类为显着（突出）或不。人类的视觉系统能够对视觉信号进行独特的感知和处理：感兴趣的区域会被优先考虑和分析，而其他区域则较少受到注意。这种能力已经在计算机视觉界以“显著对象检测”的名义进行了长期研究现代显著性目标检测方法的性能通常用F测度来评价。从信息化的角度看*M.M. 程是通讯作者。其中β2>0是精确度和重新调用之间的平衡因子当β2>1时，F度量偏向于召回率，否则偏向于精确率。大多数基于CNN的SOD解决方案[11，16，30，9，31，39，33]主要依赖于FCN [22]架构中交叉熵损失（CELoss）的优化，显着性图的质量通常由F度量评估最佳-可将与像素无关的CELoss重新定义为最小化平均绝对误差（MAE=1N|yi−yi|），因为在这两种情况下，每个预测/地面实况对独立地工作，并且对最终得分的贡献相等。如果数据标签具有有偏分布，则使用CELoss训练的模型将向多数类做出有偏预测。因此，用CELoss训练的SOD模型保持有偏的先验，并且倾向于将未知像素预测为背景，从而导致低召回检测。F-measure [29]是一种更加复杂和全面的评估指标，它将精确度和召回率结合到单个分数中，并自动抵消阳性/阴性样本之间的不平衡。在本文中，我们提供了一个统一的公式在培训和评估SOD。通过直接采用评估度量，即，以F-测度为优化目标，以端到端的方式进行F-测度最大化。为了执行端到端学习，我们提出了重新宽松的F-测度来克服标准F-测度公式中的不可微性。建议的损失函数-FLoss是一个可分解的函数。r.t后Y轴因此可以不费力地附加到CNN的后面作为监督。我们在几个最先进的SOD架构上测试了FLoss，并见证了可见的性能8850我我我增益此外，所提出的FLoss即使在饱和区域中也具有相当大的梯度，从而导致相对于阈值稳定的极化预测。我们提出的FLoss具有三个有利的特性：• 无障碍显著目标检测。使用FLoss训练的模型生成对比显着图其中前景和背景被清楚地分开。因此，FLoss可以在很宽的阈值范围内实现较高的性能.• 能够处理不平衡的数据。定义作为精确度和召回率的调和平均值，F-测量能够在不同类别的样本之间建立平衡。我们的实验证明，我们的方法可以找到一个更好的精度和召回之间的妥协• 快速收敛。我们的方法只需数百次迭代就能快速学习聚焦于显著对象区域显示出快速的收敛速度。2. 相关工作我们回顾了几种基于CNN的SOD架构和与F-测度优化相关的文献。显著目标检测（SOD）。卷积神经网络（CNN）被证明在计算机视觉的许多子领域中占主导地位。自从有线电视新闻网在苏丹人权办公室工作以来，已经取得了重大进展。国土安全部网络[19]是使用CNN进行SOD的先驱之一。DHS首先利用对比度、对象性等全局线索生成一个粗糙的显著图。然后，使用分层循环CNN逐步细化粗略地图。全卷积网络（FCN）[22]的出现提供了一种优雅的方式来执行端到端的像素推理。DCL [16]使用双流架构来处理像素和补丁级别的对比度信息。基于FCN的子流产生具有逐像素精度的显著性图，并且另一网络流对每个对象段执行推断。最后，一个完全连接的CRF [14]用于结合像素级和片段级语义。从背景中消除，同时保持高分辨率。Liu等[18]设计一个基于池化的模块，以有效地融合自上而下路径的卷积特征。自顶向下细化的思想也被Amulet [38]采用，并由Zhao等人增强。[40]第40话双修后来，Wanget al.[32]提出了一个视觉注意力驱动模型，弥合了SOD和眼睛注视预测之间的差距上述方法试图通过引入更强大的网络架构来改进SOD，从递归精炼网络到多尺度侧输出融合。我们建议读者参考最近的一项调查[3]以了解更多细节。F-measure优化尽管在许多应用领域中已被用作常见的性能指标，但直到最近，优化F度量才引起人们的注意。旨在优化F测度的工作可以分为两个子类别[6]：(a)结构化损失最小化方法，如[24，25]，其在训练期间优化作为目标的F测量;以及（b）插件规则方法，其在推理阶段优化F-测量[13，7，26，37]。对后一个亚类的研究引起了很大的注意：寻找最佳阈值这导致在给定预测的后Y的情况下的最大F测量。有几篇文章是关于优化F-在训练阶段进行测量。Petterson等人[24]通过最大化与F度量相关的损失函数间接优化F度量。然后在他们的后续工作[25]中，他们构造了离散F-测度的上界，然后通过优化其上界来最大化F-测度。这些先前的研究要么作为后处理，要么是不可微的w.r.t后验，使得它们很难应用于深度学习框架。3. 超氧化物歧化酶F测度的优化3.1. 松弛F测度在标准F测量中，真阳性、假阳性和假阴性定义为相应样本的数量：基于HED [34]的边缘检测，聚合多尺度侧输出被证明是有效的，ΣTP（Ystect，Y）=1（yiΣi==1且ystect==1），细化密集预测，特别是当详细的本地建筑物必须保存。在类似HED的架构中，更深的侧输出捕获丰富的语义，而更浅的侧输出包含高分辨率的细节。FP（Ystect，Y）=FN（Ystect，Y）=1（yi==0且ystect==1），Σi1（yi==1且ystect==0），我（二）将不同级别的这些表示结合起来将导致显著的性能改进。DSS [11]介绍了跨不同侧输出的深到浅短路连接，以使用深SEMANIC功能完善浅侧输出深到浅的短连接使浅侧输出能够区分真正的显着性。其中，Y是地面实况，Ystect是二元预测由阈值t和Y二值化的是地面实况显著性图。1（·）是一个指示器函数，如果其参数为真，则值为1，否则值为0。为了将F度量纳入CNN并以端到端的方式对其进行优化，我们定义了一个可分解的F-8851我阿吉吉阿吉吉在后验Y上可区分的度量。基于相应的梯度是基于这种动机，我们基于连续后验Y检验重新表达真阳性、假阳性和假阳性：100LlogF1μ g（1+β2）TP=（1 +β2）y−.（九）阿吉·阿吉·F·H·2·HΣTP（Y，Y）=FP（Y）=FN（Y，Y）=你好，Σiyi·（1−yi），Σi（1−yi）·yi。我（三）我们将从理论和实验上分析FLoss相对于Log-FLoss和CELoss在产生极化和高对比度显着图方面的3.3. FLoss与交叉熵损失在Eq.3、查准率p和查全率r分别为：为了证明我们的FLoss优于al-p（Y）=TPTP+FP， r（Y，Y）=TPTP+FN.（四）三种损失函数Log-Floss和交叉熵损失（CELoss），比较了这三种损失函数的定义、梯度和曲面图。CELoss的定义是：最后，我们的松弛F测度可以写为：（1+β2）p·rLCE（Y）=−Σ|Y| （yilogyi+（1−yi）log（1−yi）），F（Y，Y）=，β2p+r（1+β2）TP（五）我（十）其中i是输入图像的空间位置，|Y|是输入图像的像素数。的梯度=β2（TP+FN）+（TP+FP），（1+β2）TPLCE W. r.t预测y是：=H，CULCE =yi−1 −yi。（十一）其中H=β2（TP+FN）+（TP+FP）。由于阿吉吉yi1−yi在Eq.3，等式5是可分解的w.r.t后因此，可以将其集成到CNN架构训练中如图所示，7、Eq. 11、CELossEFLCE仅依赖于单一预测/地面实况背撑像素i;而在FLoss中，在全球范围内由3.2. 最大化CNN为了以端到端的方式最大化CNN中的松弛F度量，我们将我们提出的基于F度量的损失（FLoss）函数LF定义为：（1+β2）TP图像中所有像素的预测和地面实况我们进一步比较了两点二分类问题中的FLoss，Log-FLoss和CELoss的表面图结果如图1D所示1.一、两个空间轴表示预测y=0和y=1，z轴表示损失值。如图1、Floss的梯度不同LF（Y，Y）=1−F=1−.（六）H在两个方面与CELoss和Log-Floss不同：（1）有限梯度：FLoss保持有限的梯度值最小化LF（Y∈ ，Y）等于最大化松弛的F-测度。再次注意，LF是直接从r_a_w预测Y_n计算的，而没有阈值化。因此，LF在预测Y上是可微分的，并且可以插入CNN中。在位置i处，损失LF对净工作量Y的偏导数为：即使是预测也与事实相去甚远。这对于CNN训练至关重要，因为它可以防止梯度爆炸问题。因此，正如我们的实验所证明的那样，FLoss允许在训练阶段有更大的学习率。(2)饱和区域中的相当大的梯度：在CELoss中，当LFyF=− y预测更接近地面实况，而Floss即使在饱和区也有相当大的梯度这我我 . F=−公司简介·+HΣ·将迫使网络进行两极化的预测。图中的显著检测示例3说明Pe n g u i n Penguin.（1+β2）yi8852=−H−阿吉吉（1+β2）TPH2（七）和两极分化的预测。4. 实验和分析（1+β2）TP=H2−（1+β2）yi .H4.1. 实验配置还有另一种方法来替代Eq。6个最大化F-测度的对数似然的LlogF（Y，Y）=−log（F），（8）数据集和数据扩充。我们统一训练我们的模型和竞争对手的MSRA-B [20]培训进行公平比较。总共有5000张图像的MSRA-B数据集平均分为训练/测试子集。88531.00.80.00.20.60.40.60.40.80.21.00.01.00.80.00.20.60.40.60.40.80.21.00.01.00.80.00.20.60.40.60.40.80.21.00.01.00.80.00.20.60.40.60.40.80.21.00.01.00.80.00.20.60.40.60.40.80.21.00.01.00.80.00.20.60.40.60.40.80.21.00.0我NF损耗（公式六、Log-Floss（公式第八章）CELoss（公式10）、1.05100.8480.6360.4240.2120.000F损耗（公式六、Log-Floss（公式第八章）CELoss（公式10）、1.05100.8480.6360.4240.2120.000图1. 2点2类分类情况下不同损失函数的曲面图。从左到右的列：F-测量损失定义在等式中。6，log F-测量损失，定义在方程中。8和方程中的交叉熵损失10个。在上一行中，地面真实值是[0，1]，在下一行中，地面真实值是[1，1]。与交叉熵损失和Log-Floss相比，Floss在饱和区域仍具有相当大的梯度，这将导致产生极化预测。我们在其他5个SOD数据集上测试训练模型：[23]第24话：[25]第26话：[26]第27话：[27]第28话：[28]第29话：[23]第二十三话这些数据集的更多统计数据见表1。值得一提的是，一个数据集的显著性程度取决于很多因素，如图像的数量、一幅图像中的对象数量、显著对象与背景的对比度分析这些细节超出了本文的范围，我们请读者参考[8]以获得更多的数据集分析。数据集图像数量年Pub.对比MSRA-B [20]50002011TPAMI高ECSSD [35]10002013CVPR高香港大学-IS [15]14472015CVPR低帕斯卡尔[17]8502014CVPR介质[23]第二十三话3002010 CVPRW低[36]第三十六话51682013CVPR低就像DSS一样。Amulet [38]只允许256×256个输入。我们随机裁剪/填充原始数据以获得方形图像，然后调整它们的大小以满足形状要求。网络架构和超参数。我们在3种基线方法上测试了我们提出的Floss： Amulet [38]，DHS [20]和DSS[11]。为了验证Floss的有效性（等式6），我们用FLoss替换原始实现的损失函数，并保持所有其他配置不变。正如在第二节中所解释的 3.3，由于有限的梯度，FLoss允许更大的基本学习率。我们使用的基本学习率是原始设置的4倍例如，在DSS中，基本学习率是10−8，而在我们的F-DSS中，基本学习率是10−4。所有其他超参数都与原始实现一致为了公平的比较。评估指标。我们根据最大F测度（MaxF）来评估显着性图的性能，平均F测量（MeanF）和平均绝对误差（MAE=表1. SOD数据集的统计。“#Images”表示数据集中图像的数量，“contrast”表示前景/背景之间的一般对比度。对比度越低，数据集就越具有挑战性。数据增强对于生成足够的数据来训练深度CNN至关重要我们公平地执行原始实现及其FLoss变体的数据扩充。对于DSS [11]和DHS [19]架构，我们仅对训练图像和1N|yi−yi|）. 等式中的因子β2如[1，11，16，19，30]所示，1被设置为0.3。通过对显著性y映射Y_t应用一系列阈值t∈T，得到了具有不同精度、召回率和F-测度的二值化显著性y映射Y_stect。然后通过穷举搜索测试集来获得最佳阈值toto=argmaxF（Y，Ystect）。（十二）t∈T最后，我们用to对预测进行二值化，并评估GT=[1，1]GT=[0，1]8854训练数据ECSSD [35]香港大学-IS [15]帕斯卡尔[17][23]第二十三话[23]第二十三话模型列车#图像最大F平均F MAE最大F平均F MAE最大F平均F MAE最大F平均F MAE最大F平均F MAE[20]第二十届中国国际汽车工业展览会0.909.891.0570.903.881.0430.823.808.1010.838.817.1220.770.741.062FLossMB [20] 2.5K0.914.903.0500.908.896.0380.829.818.0910.843.838.1110.777.755.067表2.Log-Floss的性能比较（公式8）和Floss（等式（六）。在MaxF，MeanF和MAE方面，Floss在大多数数据集上的表现优于Log-Floss具体而言，由于其高对比度预测，FLoss在MeanF方面有很大的改善最佳F值：MaxF=F（Y，Ystect），（13）其中Ystecto是用t_0二进制化的二进制显着y映射。MeanF是不同阈值下的平均F度量在图2中。从表2中可以得出相同的结论，其中Floss实现了更高的平均F测量。结果表明，在较宽的阈值范围内，FLoss都能获得较高的F-测度得分。4.3. 开放基准的评价结果1平均值F=ΣF（Y，Ystect），（14）我们比较了所提出的方法与几个基地-|不|t∈T其中T是可能阈值的集合。4.2. Log Floss vs Floss首先，我们比较Floss与它的替代品，即对数Floss定义在方程。8、证明我们的选择。如SEC中的分析。3.3，Floss具有交叉熵损失和Log-Floss不具有的饱和区域中具有大梯度的优点为了实验验证我们的假设，即FLoss将产生高对比度的预测，我们分别用FLoss和Log-FLoss训练DSS [11训练数据是MSRA-B [20]，超参数与原始实现保持不变，除了基础学习率我们将基本学习率调整为10−4由于我们方法接受较大的学习率，如所解释的节中三点三定量结果在表2中，并且一些示例检测到的显著性图在图2中示出。二、尽管Log-Floss和Floss都使用F-测度作为最大化目标，但Floss得出具有高前景-背景对比度的极化预测，如图所示图2.通过Floss（底部）和Log-Floss（中间）的显着性图示例。我们提出的FLoss方法产生高对比度的显着图。5个流行数据集上的行。一些示例检测结果如图所示。3和全面的定量比较见表3。一般而言，基于FLoss的方法与基于交叉熵损失（CELoss）的方法相比可以获得相当大的改进，特别是在平均F度量和MAE方面。这主要是因为我们的方法对阈值是稳定的，从而在较宽的阈值范围内获得高性能的显着性图。在我们检测到的显著性图中，前地（显著对象）和背景被很好地分离，如图所示。3，并在SEC中解释。三点三4.4. 无阈值显著目标检测最先进的SOD方法[11，16，19，38]通常按以下方式评估最大F度量：（a）获得显着性用预训练的模型映射Yi;（b）调整最佳阈值，旧到0通过在测试集上的穷举搜索（等式2）。12）并将预测与t0二进制化;（c）根据等式12评估最大F-测量。十三岁上述方法有一个明显的缺陷：最佳阈值是通过对测试集的穷举搜索来获得的。这种程序对于现实世界的应用是不切实际的，因为我们没有注释的测试数据。即使我们在一个数据集上调整了最佳阈值，它也不能广泛应用于其他数据集。我们进一步从两个方面分析了方法对阈值的敏感性：（1）不同阈值下的模型性能，反映了方法对阈值变化的稳定性;（2）不同数据集上的最佳阈值的均值和方差，反映了一个数据集上的最佳阈值对其他数据集的推广能力图图4（a）示出了对于不同阈值的F测量对于大多数没有Floss的方法，F-测度随阈值急剧变化，并且最大F-测度（MaxF）仅存在于窄的阈值范围内。虽然基于Floss的方法几乎不受Log-FlossGT牙线图像8855[11]第19届中国国际纺织品展览会[2019-03 - 19]图3.几个流行数据集上的显著对象检测示例。F-DHS，F-Amulet和F-DSS表示使用我们提出的FLoss训练的原始架构。FLoss会导致明显的自信，特别是在对象边界上。[23]第23届中国国际纺织品博览会[24模型列车#图像MaxF 平均F MAEMaxF 平均F MAEMaxF 平均F MAEMaxF 平均F MAEMaxF 平均F MAERFCN[30]MK [5]10K.898.842.095.895.830.078.829.784.118.807.748.161---DCL[16][20]第二十话2.5K.897.847.077.893.837.063.807.761.115.833.780.131.733.690.095国土安全部[19][23]第二十三话9.5K.905.876.066.891.860.059.820.794.101.819.793.136---护身符[38]MK [5]10K.912.898.059.889.873.052.828.813.092.801.780.146.737.719.083国土安全部[19]MB2.5K.874.867.074.835.829.071.782.777.114.800.789.140.704.696.078[19]第十九话MB2.5K.884.879.067.859.854.061.792.786.107.801.795.138.707.701.079护身符[38]MB2.5K.881.857.076.868.837.061.775.753.125.791.776.149.704.663.098Amulet-FlossMB2.5K.894.883.063.880.866.051.791.776.115.805.800.138.729.696.097[第11话]MB2.5K.908.889.060.899.877.048.824.806.099.835.815.125.761.738.071DSS+FLossMB2.5K.914.903.050.908.896.038.829.818.091.843.838.111.777.755.067表3.不同方法在6个流行数据集上的定量比较。我们提出的FLoss在MAE（越小越好）和F-measure（越大越好）方面始终提高性能。特别是在平均F测量方面，我们的表现优于最先进的非常清晰的边缘，因为我们的方法能够产生高对比度的预测，可以在广泛的阈值范围内实现高F测量。门槛的变化图图4（b）反映了不同数据集之间的t0的均值和方差传统的方法（DHS，DSS，Amulet）在不同的数据集上表现出不稳定性，如其巨大的差异。而基于FLOSS的方法（F-DHS、F-Amulet、F-DSS）的t0在不同的数据集和不同的骨干网络架构上保持不变最后，我谨指出，拟议的FLoss对以下情况稳定：8856DSSF-DSS精确召回F-测度MaxF0.901.000.880.920.860.840.840.760.820.800.0 0.2 0.4 0.6 0.81.0阈值（一）0.68（b）第（1）款图4.（a）ECSSD数据集上不同阈值下的F-测度（b）最优阈值的均值和方差。基于FLOSS的方法在不同的数据集（较低的方差）和不同的骨干架构（F-DHS、F-Amulet和F-DSS保持非常接近的均值）上保持稳定。0.920.89表4中的另一个实验表明，我们的方法比简单地指定损失重量执行得更好。我们定义了正/负样本之间具有权重因子的平衡交叉熵损失Σ|Y|0.860.83L平衡=w1·yilogyi+我w0·（1 − y i）log（1− yi）。（十五）确定阳性/阴性样品的损失重量0.80通过小批量中的正/负比例开采：0.0 0.2 0.4 0.6 0.8 1.01Σ|Y|1Σ|Y|阈值w1=|Y|i1（y i== 0）和w0=|Y|i1（yi==1），图5. 不同阈值下DSS（- - -）和F-DSS（-）的查准率、查全率、F-测度和最大F-测度。DSS倾向于预测未知像素作为大多数类-后面-地面，导致高精度但低召回。Floss能够在精确度和召回率之间找到更好的折衷。三个方面的阈值t：（1）在较宽的阈值范围内具有较高的性能;（2）在一个数据集上调整的最佳阈值可以转移到其他数据集上，因为在不同的数据集上调整的最佳阈值略有不同;以及（3）从一个主干架构获得的T可以应用于其他架构。4.5. SOD中的标签不平衡问题在SOD中，前景和背景是有偏的，其中大多数像素属于非显著区域。不平衡的训练数据会导致模型陷入局部极小，从而倾向于将未知像素预测为背景。因此，召回率将成为评估期间性能的瓶颈，如图所示。五、虽然将损失权重分配给阳性/阴性样本是抵消不平衡问题的简单方法，如[34]和[28]所示。4.6. 精确度和召回率之间的妥协查全率和查准率是两个相互冲突的度量标准。在某些应用中，我们关心的召回率比精度更高，而在其他任务中，精度可能比召回率更重要。在Eq.1在评估特定任务的性能时平衡了精确度和精确度之间的偏差例如，最近关于边缘检测的研究使用[2，34，28]β2=1，表明其在精确度和召回率上的平等考虑。而显着性检测[1，11，16，19，30]通常使用β2=0。3.强调查准率高于查全率。作为优化目标，FLoss还应该能够来平衡精确度和召回率我们用不同的β2训练模型，并从精确度、召回率和F-测度方面综合评估它们的性能结果见图。6揭示了β2是精确率和召回率之间的偏差调节器：较大的β2导致较高的再调用，而较小的β2导致较高的精确率。4.7. 更快的融合和更好的性能在这个实验中，我们训练了三个最先进的显着性检测器（Amulet [38]，DHS [20]和DSS [11]）护身符[38]Amulet+Floss国土安全部[19]DHS+牙线[第11话]DSS+FLossFLossCELoss平均值（to）var（to）F-measuremean（to）和var（to）8857Train #图像[23]第23届中国国际纺织品博览会[24型号MaxF MeanF MAE MaxF MeanF MAE MaxF MeanF MAE MaxF MeanF MAE MaxF MeanF MAE[第11话][20]第二十话2.5K.908.889.060.899.877.048.824.806.099.835.815.125.761.738.071DSS+余额[20]第二十话2.5K.910.890.059.900.877.048.827.807.097.837.816.124.765.741.069DSS+FLoss[20]第二十话2.5K.914.903.050.908.896.038.829.818.091.843.838.111.777.755.067表4.跨原始交叉熵损失的性能比较（等式2）10），平衡的交叉熵损失（方程10）。15）和我们提出的FLOSS（方程。（六）。原始交叉熵学习偏向主类（背景）的先验。这是由低召回证明：由于有偏差的先验，许多正的点被误预测为负的。通过在前景/背景样本上分配损失权重，平衡的交叉熵损失可以缓解不平衡问题。我们提出的方法比平衡交叉熵损失更好，因为F-测量标准可以自动调整数据不平衡。0.950.900.850.80电话：+86-0511 - 8888888传真：+86-0511 - 88888882图6.在不同β2下训练的模型的精确度、召回率、F-度量（等式①的人。随着β2的增大，查准率降低，而查全率增大。这个特性给了我们很大的灵活性来调整查全率和查准率之间的平衡：在调用优先应用程序中使用较大的β 2，否则使用较小的β2。和他们的对手。然后，我们在每个检查点绘制所有方法的性能，以确定各自的模型的收敛速度和收敛性能所有模型都在MB [20]数据集上进行训练，并在ECSSD[35]数据集上进行测试。结果示于图7 .第一次会议。0.8750.8250.7750.7250.6750.625称为数百次迭代。而基于交叉熵的方法产生模糊的输出并且不能非常精确地定位显著如图7、基于FLoss的方法比交叉熵方法收敛更快，具有更好的收敛性能。5. 结论在本文中，我们提出了直接最大化的F-措施的显着目标检测。我们引入了预测后验可微的FLoss作为CNN的优化目标所提出的方法在更好地处理有偏数据分布方面实现了更好的性能。此外，我们的方法是稳定的对阈值，并能够产生高质量的显着性图在较宽的阈值范围内，显示出巨大的潜力，在现实世界中的应用。通过调整β2因子，可以很容易地调整精确度和召回率之间的折衷，从而能够灵活地处理各种应用。几个流行的数据集上的综合基准测试说明了所提出的方法的优势今后的工作。我们计划通过使用最近的骨干模型来提高所提出的方法的性能和效率，[10、27]。此外，FLoss对其他二进制密集预测任务有潜在的帮助，例如边缘检测[21]，阴影检测[12]和骨架检测[40]。谢谢。本研究得到了国家自然科学基金（61572264，61620106008）、国家青年人才支持计划和天津市自然科学基金（17JCJQJC 43700，18ZXZNGX 00110）的资助。0.1 0.3135101520253035 40迭代次数（K）图7.性能与训练迭代。我们的方法具有更快的收敛速度和更高的收敛性能。我们观察到，我们的FLoss为所有三个显着性模型提供了每次迭代的性能提升我们还发现，基于FLOSS的方法可以快速学习专注于显著对象区域，并在引用[1] Radhakrishna Achanta ， Sheila Hemami ， FranciscoEstrada，and Sabine Susstrunk.频率调谐显著区域检测。在CVPR，第1597-1604页[2] 巴勃罗·阿贝莱斯，迈克尔·梅尔，查利斯·福克斯，还有吉坦德拉·马利克.轮廓检测和分层图像分割。IEEEPAMI，33（5）：898精准召回F-measureDFDSSF-SDH让- 阿穆不ule是DSSF -SS平均F-测度性能8858[3] Ali Borji、Ming-Ming Cheng、Qibin Hou、Huaizu Jiang和Jia Li。显著对象检测：一个调查。计算视觉媒体，5（2）：117[4] Ali Borji、Ming-Ming Cheng、Huaizu Jiang和Jia Li。显著对象检测：基准。TIP，24（12）：5706[5] Ming-Ming Cheng ， Niloy J Mitra ， Xiaolei Huang ，Philip HS Torr，and Shi-Min Hu.基于全局对比度的显著区域检测。IEEE PAMI，37（3）：569[6] Krzysztof Dembczynski ， Arkadiusz Jachnik ， WojciechKot-l o wski，WillemWa e geman，andEy k eHüllermeier.优化多标签分类中的f-测度：插入式规则方法与结构化损失最小化。ICML，第1130-1138页，2013年[7] Krzysztof J Dembczynski，Willem Waegeman，WeiweiCheng，andEy k eH üllermeier. f-测度最大化的一个精确算法NeurIPS，第1404-1412页，2011年[8] 范登平，刘江江，高尚华，侯启斌，阿里·博尔吉，程明明。杂乱中的显著对象：将显著对象检测带到前景。ECCV，2018年。[9] Deng-Ping Fan，Wenguan Wang，Ming-Ming Cheng，and Jianbing Shen.将更多的注意力转移到视频显著对象检测上。在CVPR中，第8554-8564页[10] Shang-Hua Gao，Ming-Ming Cheng，Kai Zhao，Xin-YuZhang，Ming-Hsuan Yang，and Philip Torr. Res2net：一种新的多尺度骨干网架构。IEEE TPAMI，2019。[11] Qibin Hou ， Ming-Ming Cheng ， Xiaowei Hu ， AliBorji，Zhuowen Tu，and Philip Torr.具有短连接的深度监督显著对象检测。IEEE TPAMI，41（4）：815[12] Xiaowei Hu ， Lei Zhu ，Chi-Wing Fu ，Jing Qin ， andPheng-Ann Heng.用于阴影检测的方向感知空间上下文特征。在CVPR，2018年6月。[13] 马丁·杨舍二进制序列标记的最大期望效用框架。在计算语言学协会年会的会议记录中，第736-743页[14] Phi l ippKr aühenbuühl和VladlenKoltun。具有高斯边势的全连通crfs的有效推理在NeurIPS，第109-117页[15] 李冠斌、余益州。基于多尺度深度特征的视觉显著性。CVPR，2015年。[16] 李冠斌、余益州。用于显著对象检测的深度对比度学习在CVPR，第478-487页[17] Yin Li，Xiaodi Hou，Christof Koch，James M Rehg，and Alan L Yuille.显着对象分割的秘密。在CVPR，第280-287页[18] Jiang-Jiang Liu，Qibin Hou，Ming-Ming Cheng，JiashiFeng，and Jianmin Jiang.一个简单的基于池的实时显著对象检测设计。在CVPR，2019年。[19] 刘念和韩俊伟。Dhsnet：用于显着对象检测的深度层次显着网络在CVPR，第678-686页[20] Tie Liu ， Zejian Yuan ， Jian Sun ， Jingdong Wang ，Nanning Zheng，Xiaoou Tang，and Heung-Yeung Shum.学习检测显著物体。IEEE PAMI，33（2）：353[21] Yun Liu ， Ming-Ming Cheng ， Xiaowei Hu ， Jia-WangBian，Le Zhang，Xiang Bai，and Jinhui Tang.更丰富的卷积特征用于边缘检测。IEEE TPAMI，41（8）：1939– 1946,[22] 乔纳森·朗埃文·谢尔哈默和特雷弗·达雷尔用于语义分段的全卷积网络。在CVPR，第3431-3440页[23] Vida Movahedi和James H Elder。显著对象分割的性能测量的设计和感知验证。见CVPR-讲习班，第49-56页[24] 贾姆·佩特森和提比·里奥·卡埃塔诺。反向多标签学习。NeurIPS，第1912-1920页，2010年[25] 贾姆·佩特森和提比·里奥·卡埃塔诺。子模块多标记学习。NeurIPS，第1512-1520页，2011年[26] 乔斯·雷蒙·奎韦多，奥斯卡·卢阿塞斯，安东尼奥·巴哈蒙德 . 具有概率阈值策略的多标记分类器。 PatternRecognition，45（2）：876[27] 放大图片作者：Andrew G. Howard，Menglong Zhu，AndreyZhmoginov，andLiang-ChiehChen.Mobilenetv2：反演残差和线性瓶颈。在CVPR，2018年6月。[28] 沈伟，王兴刚，王艳，白翔，张之江.深轮廓：通过正共享损失学习的深度卷积特征，用于轮廓检测。在CVPR，第3982-3991页[29] 科内利斯·约斯特·范·雷斯伯根。评价的基础Journal of Documentation，30（4）：365[30] 王林钊、王丽君、卢沪川、张平平、阮翔。使用循环全卷积网络进行显著性检测参见ECCV，第825-841页[31] Wenguan Wang ， Jianbing Shen ， Ming-Ming Cheng ，and Ling Shao.一个迭代和合作的自上而下和自下而上的推理网络，用于显著对象检测。在CVPR中，第5968-5977页[32] Wenguan Wang，Jianbing Shen，Xingping Dong，andAli Borji.由注视预测驱动的显著对象检测。在CVPR中，第1711-1720页[33] Wenguan Wang，Shuyang Zhao，Jianbing Shen，StevenCH Hoi，a

下载后可阅读完整内容，剩余1页未读，立即下载