小样本学习的误区与真知：预训练模型与prompt方法的挑战

版权申诉

128 浏览量更新于2024-08-04 收藏 2.35MB PDF 举报

小样本学习（Few-shot Learning）是一种机器学习方法，其核心思想是在训练数据量极其有限的情况下，让模型快速适应新的任务。传统的理解是，小样本学习通常涉及在一个大型训练集之外，仅提供极少数（例如几个或几十个）样本来训练模型，并在新的n-way k-shot任务中进行预测，这与现实世界中的数据稀缺情况相去甚远。早期的小样本学习研究主要依赖于大规模的预先训练模型，如GPT3，通过少量的finetuning来适应新任务。这种方法利用了预训练模型的广泛知识和结构，通过设计特定的提示（prompt）来引导模型完成任务。例如，给GPT3一个固定的模板，如“Question: ... Answer: ...”，让模型自行填充答案部分。然而，最近的研究指出，即使在基于prompt的方法取得显著进展的情况下，这并非真正意义上的小样本学习。论文《True Few-Shot Learning with Language Models》（http://arxiv-download.xixiaoyao.cn/pdf/2105.11447v1.pdf）提出，现有的任务设定存在局限，因为它允许研究人员使用庞大的验证集来优化prompt的选择和参数调整，这种做法脱离了实际小样本环境，因为真正的挑战应该是在训练集和验证集都非常有限的条件下进行。作者们强调，为了实现真正的小样本学习，研究应该集中在更严格的任务设定上，即训练集和验证集都保持在很小规模。他们对挑选prompt和调整参数的效果进行了实验，结果显示，对于模型在小样本条件下的学习能力，我们的评估可能过于乐观。该论文的代码可在<https://github.com/ethanjperez/true_few_shot>获取。这篇论文提出了一个名为True Few-Shot Learning的新框架，旨在更准确地模拟和推动小样本学习技术的发展，以便更好地应用于实际应用场景，如缺乏大量标注数据的自然语言理解和计算机视觉等领域。这对于推动AI技术的实用性和普适性具有重要意义。

恕

我

直

⾔

，

很

多

⼩

样本

学

习

的

⼯

作

就

是

不

切

实

际

的

⽂

𝕚𝕧𝕖𝕟

编

⼩

轶

以

前

的

⼩

样本

学

习

（

Few-shot Learning

），

是

需

要

⽤

⼀个

巨

⼤

的

训

练

集

训

练

的

。

测

试

时

只

给

出

n-way k-shot

，

在

这

N * k

个

样本

上

学

习

并

预

测

。

我

第

⼀

次

看

到

这

种

任

务

设

定

的

时

候

真

是

⾮

常

失

望

：

这

和

现

实

情

况

的

需

求

也

相

差

太

远

了

！

真

实

场

景

下

的

⼩

样本

学

习

，

哪

有

⼤

量

的

训

练

数据

呢

？

从

GPT3

开

始

，

学

术

界

开

启

了

⼀个

新

的

⼩

样本

⻛

潮

。

借

助

预

训

练

模

型

，

⼈们

只

给

出⼏

条

或

⼏

⼗

条样本

作为

训

练

集

，

⽤

⼩⼩

训

练

集

进

⾏

finetune

。

看

到

这

些

⼯

作

，

我

觉

得

这

样

才

是

真

正

的

⼩

样

本

学

习

！

最

近

有

⼀

些

⼯

作也

在

这

种

任

务

设

定

下

取

得

了

不

错

的

进

展

。

所

谓

prompt

，

就

是

结

合

具

体

场

景

，

设

计

新

的

finetune

任

务

形式

，

从

⽽

将

与

当

前

任

务

相

关

的

提

示

信

息

（

prompt

）

引

⼊

模

型

，

以

此

更

好

地

利

⽤

预

训

练

模

型

的

结

构

与

先

验

知

识

。

我

们

⼤

名

鼎鼎

的

GPT

系

列

就

是

这

么

⼲

的

。

⽐

如

我

们

拿

GPT3

做

的

finetune

，

直

接

喂

给

他

⼀

串

“Question

：

问题

内

容

Answer

：

”

，

剩

下

的

答

案

部

分

就

让

GPT3

⾃

⼰

填

完

。

𝕚𝕧𝕖𝕟

2021-06-16

12:05

原

创

夕

⼩

瑶

的

卖

萌

屋

下载后可阅读完整内容，剩余7页未读，立即下载

普通网友

粉丝: 1283

小样本学习的误区与真知：预训练模型与prompt方法的挑战

恕我直言，很多小样本学习的工作就是不切实际的.rar

恕我直言，你的实验结论可能严重依赖随机数种子！ .pdf

恕我直言，你的模型可能并没看懂 prompt 在说啥.pdf

spring boot get协议访问 json报文 www.hello.com/api/acount

springboot项目打包之后在boot inf

表白c++程序代码完整版委婉

一位客户非常生气地来投诉，您去询问缘由，客户直说您管不了，要求您的领导来，这时您会怎么处理？

面试官问是否接受出差该如何回答

直言判断及其结构与种类.pdf

一年级拼音故事 小乌龟找工作.pdf

最新资源

一年级拼音故事小乌龟找工作.pdf