其中,Rec(i)表示召回率从d
i
−
1
到d
i
的变化。然后在t
IoU [0]的范围内对AP t IoU求平均
。
50
,
0
。
55...
、
0.
95]
,并在所有对象类别上,以获得最终平均平均精度
(mAP)值,该值是
检测器的统一性能指标。还使用的mAP
50
是t IoU = 0
的类平均AP
。
50块
mAP度量的官方基准实现应用精确度-召回率曲线的
最大插值和特定召回值的点采样[24,9,31]。这可以
产 生 比 Eq. ( 三 ) 、 我 们 还 使 用 了 官 方 的 Common
Objects in Context数据集[24](COCO)评估脚本,以
便在基准测试中获得更好的可比性。
置信度校准。置信
度校准的目标是使每个预测的
ci
等于经验对象检测器对于
TP
预测
P
(
τ i =1 d = di
)
的概率。 从这里开始我们把它记为
Pi
简而言之。
对于置信度校准,我们认为目标检测器是一个随机
过程。预测
d i
的标签现在由随机变量
T
i
Bernoulli
(
P
i
)表示,其中
τ
i
具有
t
IoU
= 0
。
第
50
章作为一个
样本
P
i
也可以被看作是对象检测器对于具有相同置
信度
c
i
的一组检测的精度
;
我们将
P
i
称为
“
成功
”
或
TP
检测的概率(一)
.
该符号还使该
定义与分类神经网络
的置信度校准
兼容
[13]
,因为
P
(
τ
i
=1
)等效于分类器
的经验准确度。大多数基于深度学习的对象检测器
在其
置信度估计[27,22]。因此,置信度校准的目标是找
到一个映射f
,
该映射f估计输入区间上的真实置信度
校准曲线
f
(0
,
1]:
通过采用具有位于置信区间内的置信度的检测并计算
作为TP的检测的分数来计算
TP
检测
在
区间
内的估计概
率
P
_m
具有置信
度
c
i
的某些检测d
i
的直方图分箱校准是
一个简单的
查找对应的计算的平均
P
_
m
_
n
,
bin
C
m
c
i
C
m
.
直方图分箱可以扩展到
多变量校准方案[22]。对于条件相关的分箱,我们首
先根据检测的盒大小将检测分割成箱B,然后对每个
不相交的检测子组执行详细描述的直方图分箱。这个
更一般的校准函数
f
∈
C
,
B
(
d
)
产生条件
概率P
的估
计
,如等式2所述。(五)、
4.
目标探测器
我们假设条件置信偏差[22]正在损害目标检测器的
性能。图1我们基于具有不同校准曲线的两组检测的夸
张示例来可视化此想法。每个组仅具有具有单个相应
置信度值的检测,并且对于该示例,很明显,置信度
阈值为0.55的检测器对于未校准的检测(0,1)将具
有50%的精度,在精确召回曲线中可以观察到相关的
改善。该曲线下面积与AP度量密切相关[31]。我们的
简单示例和假设表明,对象检测器的置信度估计中关
于边界框大小和位置的偏差[22]正在损害检测器的性
能。我们感兴趣的是这个假设的正式证明。
f
(
c
i
)
=
P(
τ
i
= 1
|
c
=
c
i
)
。
(
四)
Kuppers
等在
P
i
上划分还取决于预测
边界框大小和位
置,而不仅仅取决于
c
i
:
f
(
di
)
=
P
(
τ
i
=
1
|
c
=
c
i
,
b
=
b
i
)
。
(
五)
为简单起见,我们仅关注用于条件置信度校准的预测
边界框(h w)的大小,忽略位置(x
,
y)。置信度
校准的挑战在于,我们只能从每个T
i
4.1.
最大化平均精度
为了证明我们的假设,即置信偏差会损害对象检测
器的性能,我们来看看任何t
IoU
的AP
t
IoU
如何与P相关,
以及如何在一组检测中将其最大化。一个物体探测器
可以被看作是一个随机过程(见第二节)。3)所以我
们需要分析预期的AP。从等式(3)我们得到
一次条件概率P需要从所有可能的置信度值c(
0
,
1]
上
的二元结果τ
中
估计;因此,这是一个密度估计问题。
直方图分组。
最直接的黑盒校准方法之一是直方图分
箱[49]。对于直方图分箱,预测被分组为M
替换方程(1)和(2)和我们的随机指标变量T,我们
得到: