ConMatch：利用置信度指导的一致性正则化进行半监督学习

半监督学习

训练方法

180 浏览量更新于2024-06-19 收藏 2.79MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

资源详情

资源推荐

+v：mala2255获取更多论

文

Sigmoid

线性

ReLU

线性

ReLU

线性

ReLU

线性

ReLU

线性

A A D

一

6 J. Kim等人。

整体架构

置信度估计块

（参数法）估计置信度

特征

分类器

输出

图二、

ConMatch

的网络配置建立

在一致性损失基础上的半监督学习框架，

具有额外的强分支以利用两个强分支之间的一致性损失。在参数化方法中，

置信度估计器块将级联的异构特征作为输入，并产生伪标签的估计置信度。

[2019 - 04 - 15][2019 - 04 - 15][2019 - 04][2019 - 04 - 15][2019 -04][2019 - 04 -

04][2019 - 04][2019

self

=D（

（

）

，

（

））

，

（2）

其中，分别从具有两个不同的强增强图像i（）和j（）的图像中提取

（

）

= f

（

））和

（

）= f

（

））。（

，

）可以定义为对比

损失[22]或负余弦相似性[10]。即使

这种

损失

有助于

最大限度地

学习

特征

编码

器

（

），

但是

简单地提取特征

（

）和

（

）的机制对于提升

半监督学习器并打破潜在特征空间可能不是最佳的，而不考虑表示哪

个分支更好的方向。

3.2 制剂

为了将半监督学习和自监督学习范式结合在一起，与[25，33，34]不同，

我们提出有效地利用两

个强

分支之间的自监督来促进半监督学习，称为

ConMatch。与现有的自监督表示学习方法不同，例如，SimSiam [10]中，

我们在类logit-级别

制定一致性正则化损失，如在半监督学习方法[47，58]

中所做的那样，并估计来自两

个强

增强图像的每个伪标签的置信度，对

于

，

（

）和

（

），并使用它们来考虑它们之间每个方向的概率。由

于测量这种信心是众所周知的挑战，我们提出

在本文

中，

类

logit

表示

网络

的

输出

，

即，

m o

de l

（

;

）

对于r

一致性损失

置信度估

计器

置信度损失

置信度估

计器

无监督损失

分类器

特征编

码器

特征编

码器

弱螺旋

特征编

码器

strong aug 1 strong aug 2图片

+v：mala2255获取更多论

文

ConMatch 7

基于

弱

增广图像输出的置信度估计

（

）作为非参数和参数方法中的锚点。

我们的ConMatch概述如图2所示。具体地说，

强

增强图像有两个分支

（称为强分支），

弱

增强图像有一个分支（称为弱分支）.类似于现有的

半监督表示学习方法[47，54，58]，我们尝试在一对强分支和弱分支之间

应用一致性损失。但是，针对半监督学习，我们提出了两个强分支之间

的置信度引导的一致性正则化损失

ccr

，使得

ccr

（

）

（

）

，

m ode l

（

）;

））

（

）

（

）

，

ode l

（

| A

（

）;

））

，

（3）

其中，

（

）

和

（

）

表示

从

_m_de_l

（

）生成的伪标签，

（

）;

）

和

mode l

（

）;

），

分别

为

：

（

）

和d

（

）

表示

（

）

和

（

）的估计置信度。

我们

提出

的

损失函数与

传统

的

自

监督表示学

习损失

函数

不同

，因为一致性应用于类似于[47，58]的logit级别（而

不是特征级别），并通过估计的置信度进行调整。然而，与[42，

47，52，54，58]不同的是，我们可以

通过考虑两个强增强视图来学

习更好的特征表示，同时提高

半监督学习性能。应该注意的是，这

个简单的损失函数可以与任何半监督学习器结合[47]第58话：你是

谁？

为了

测量

置信度

（

）

和

（

），

我们提出了两种

基于非参数和

参数方法的置信度估计。在下文中，我们将详细解释如何测量这些置

信度。

3.3

测量置信度：非参数方法

现有的半监督学习方法[30，44，47]选择了具有高置信度的未标记样本作

为训练目标（即，伪标签）;这可以被视为熵最小化的一种形式[19]。众

所周知，为这种手工制作的置信度估计设置适当的阈值是不平凡的，因

此，基于置信度的策略通常遭受伪标签探索和取决于阈值的准确性之间

的困境[1，34]。

在我们的框架中，如果简单地使用传统的手工方法[30，44，47]，则

从强分支估计伪标签的置信度可能会受到类似的限制。为了克服这个问

题，我们提出了一种新的方法

来

测量

置信度，

（

）

和

（

），

基于

强

增强图像和

弱

增强图像的输出之间的

相似性

基于强增强图像和弱增强

图像的logit或概率之间的相似性可以直接用作置信度估计的假设，我们

提出了度量每个强分支损失的置信度的方法

剩余30页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

ConMatch：利用置信度指导的一致性正则化进行半监督学习

监督学习、半监督学习、无监督学习与自监督学习

半监督学习训练之后到底会输出什么

yolov8实时监测 调整置信度

cotraining算法实现半监督学习数字识别任务，怎么选择置信度最高的作为有标注数据加入到训练数据中的代码并注释

图神经网络中的置信度

最大似然估计mle的渐近性是指估计量对于够多的数据记录时,满足正则化条件,其

深度学习模型置信度计算公式

dataset=[[1, 3, 4], [2, 3, 5], [1, 2, 3, 5], [2, 5]],计算R:3->5的置信度的代码

如何让yolov7中只检测出置信度最高的A类目标和置信度前两个的B类目标

深度学习中什么是置信度

yolov5 提升置信度

python中的置信度

基于半监督学习的深度神经网络有哪些？

yolov8显示置信度

置信度损失与分类损失的区别，举例说明

深度学习网络的置信度

YOLO v5中显示置信度的代码在哪里

yolo模型置信度计算方法

mAP中的置信度阈值

机器学习中一致性度量是什么

最新资源

yolov8实时监测调整置信度