![](https://csdnimg.cn/release/download_crawler_static/87401467/bg5.jpg)
难样本构造、剔除假负样本、正样本扩充及构造多
视角样本四种方法.图像增广层可以细分为图像变
换、图像合成及图像语义增广三种方法.网络架构
层方法可以分为同步对称、同步非对称、异步对称、
异步非对称对比学习,及基于聚类的网络架构.特
征提取网络主要使用ResNet
[30]
(Residualneural
network)、Transformer
[31]
等主流神经网络结构,损
失函数层分为基于互信息的损失函数、传统损失函
数和混合损失函数.下面将分别介绍各类型的方法.
2.2样本处理及样本对构造方法
在对比学习过程中,样本对的选择指的是对数
据集的采样过程.1)对无标注数据集,通常采用随
机采样的方法构建一个批次的数据,因此一个批次
的数据可能存在类别分布不均匀的情况,导致假负
样本的出现及困难负样本过少的问题;2)对有标注
数据集,通过标签信息采样训练数据,能够有效提
高对比学习效果.下面将分别介绍各种细分的样本
处理及样本对构造方法.
2.2.1困难样本构造
如图4所示,图(a)是狗,图(b)是狼,在选择
样本进行模型训练的时候,这两种动物在视觉上相
似度很高,同时在经过网络提取特征之后,他们的
特征之间的余弦相似度也比较高,容易被误认为是
相同类的样本,而这两张图像并非同类,这种情况
称为困难负样本对,同理,若两张图片属于同一类,
但特征相似度不高则称为困难正样本对.多个研究
表明,困难负样本和困难正样本对在对比学习中具
有至关重要的作用.
(b) 狼
(b) Wolf
(a) 狗
(a) Dog
图4困难负样本对示例
Fig.4Exampleofhardnegativepair
Zhu等
[32]
通过对MoCo算法训练过程的可视
化分析,发现增加困难样本在同批次中的比例能够
提升网络在下游任务中的表现.通过这一现象,作
者提出了在特征空间上将负样本对图像对应的两个
特征向量插值,正样本对图像对应的两个特征向量
特征提取
特征提取
投影头投影头
损失计算
x
1
x
2
X
特征提取
特征提取
投影头
损失计算
x
1
x
2
X
特征提取
动量
更新
动量
更新
特征提取
投影头
投影头
损失计算
正
正
负
x
1
x
2
X
队列
特征提取
动量
更新
动量
更新
特征提取
投影头
投影头
投影头
损失计算
x
1
x
2
X
同步对称架构
困难样本构造
图像变换方法
图像合成方法
图像语义增广
剔除假负样本
正样本扩充
构造多视图样本
样本对构造 图像增广 网络架构 特征提取网络结构
同步非对称架构
异步对称架构
异步非对称架构
X
X′
语义增广器
ResNet
Transformer
Input
Fc 1000
Maxpool/2
Avgpool/2
7*7 conv, 64, stride = 2
1*1 conv, 64
3*3 conv, 64
1*1 conv, 256
1*1 conv, 128
3*3 conv, 128
1*1 conv, 512
1*1 conv, 256
3*3 conv, 256
1*1 conv, 1024
1*1 conv, 512
3*3 conv, 512
1*1 conv, 2048
Add & Norm
Add & Norm
Add & Norm
Add & Norm
Add & Norm
Multi-Head
attention
Multi-Head
attention
Multi-Head
attention
Input
Feed forward
Feed forward
3*
4*
6*
3*
图3对比学习的整体流程及各模块的细分类方法
Fig.3Overallframeworkofthecontrastivelearningprocessandthesub-categoryofeachmodule
1期 张重生等:深度对比学习综述 19