
models” [4], we should expect that more and more efforts
will be dedicated to the design of procedures that allow for
the efficient adaptation of pre-trained large models under
a variety of circumstances. In other words, these models
will be “trained once” on a vast dataset and then adapted
at test time to newly-encountered scenarios. Besides be-
ing important for resource reuse, being able to abstract the
pre-training stage away from the adaptation is paramount
in privacy-focused applications, and in any other situation in
which preventing access to the training data is desirable. To-
wards this goal, it is important that, from the point of view
of the adaptation system, there is neither access to the train-
ing data nor the training procedure of the model to adapt.
With this context in mind, we are particularly interested in
designing adaptation methods ready to be used in realistic
scenarios, and that are suitable for a variety of models.
8344
0
无参数在线测试时适应
0
MalikBoudiaf´ETSMontreal*RomainMuellerFiveAIIsmailBenAyed´ETS
MontrealLucaBertinettoFiveAI
0
摘要
0
对于研究人员和从业者来说,训练最先进的视觉模型变得代
价高昂。为了提高可访问性和资源重用性,重点是将这些模
型适应到各种下游场景中。在线测试时适应是一种有趣且实
用的范例,根据该范例,训练数据不可访问,测试分布中没
有来自标记数据,适应只能在测试时和少量样本上进行。在
本文中,我们研究了测试时适应方法在各种真实场景中的表
现,显著扩展了它们最初的评估方式。我们发现,它们只在
狭义的实验设置中表现良好,并且有时在超参数未针对相同
场景进行选择时会发生灾难性失败。考虑到最终在测试时可
能遇到的条件的不确定性,我们提出了一种特别“保守”的
方法,该方法通过拉普拉斯调整的最大似然估计(LAME)
目标来解决问题。通过调整模型的输出(而不是其参数),
并使用高效的凹凸过程解决我们的目标,我们的方法在各种
场景中表现出更高的平均准确性,同时速度更快,内存占用
更低。代码可在https://github.com/fiveai/LAME上找到。
0
1.引言
0
近年来,对于许多机器学习问题,训练最先进的模型已经成为一项庞大的计算任务(例如,[5,13,
38])。例如,据估计,每次GPT-3的训练会产生相当于552吨二氧化碳的排放量,这大约相当于从
纽约到旧金山的六次航班的排放量[35]。正如“基础模型”白皮书[4]中所暗示的,我们应该预计将
会有越来越多的工作致力于设计在各种情况下能够高效适应预训练大模型的过程。换句话说,这些
模型将在广泛的数据集上进行“一次训练”,然后在测试时根据新遇到的场景进行适应。除了资源
重用的重要性外,从适应系统的角度来看,将预训练阶段与适应阶段分离开来对于注重隐私的应用
程序以及任何希望防止访问训练数据的情况都是至关重要的。为了实现这个目标,重要的是从适应
系统的角度来看,既不能访问训练数据,也不能访问模型的训练过程。在这种背景下,我们特别关
注设计适应方法,以便在实际场景中使用,并适用于各种模型。
0
*作为FiveAI研究实习的一部分完成的工作。通讯作者:malik.boudiaf.1@etsmtl.net
0
许多现实世界应用程序的一个共同特点是需要在线进行适应
,并且数据量有限。也就是说,在接收数据时,我们应该能
够进行适应。以自动驾驶车辆或无人机可能配备的视觉模型
为例。在测试时,它将接收高度相关的数据流(非独立同分
布的视频流),这些数据可以用于适应。我们希望能够确信
利用这些信息将是有用的,而不会对可能存在于训练和测试
数据之间的任何类型的领域转移产生破坏性的影响。这些转
移可能是“低级”的(例如,数据流受到从未在加利福尼亚
阳光明媚的训练阶段遇到过的雪天天气的影响),或者是“
高级”的(例如,数据包括迈阿密海滩历史区的装饰艺术建
筑),甚至是两者的组合。总之,我们对设计能够进行测试
时适应的系统感兴趣,这些系统:1)是无监督的;2)可以
在线操作并处理可能的非独立同分布数据;3)不假设对训
练数据或训练过程有任何了解;4)不针对特定模型,以便
可以直接利用社区的进展。
0
这个问题规范属于最近几项研究工作[1,27,29,
56]中研究的完全测试时适应范式,其中简单的技术如测试
时