ACL'22论文揭示：prompt范式隐藏误导，顺序至关重要

版权申诉

172 浏览量更新于2024-08-04 收藏 2.44MB PDF 举报

在2022年ACL（Association for Computational Linguistics）会议上，一篇杰出论文《Fantastically Ordered Prompts and Where to Find Them: Overcoming Few-Shot Learning Challenges》引起了广泛关注。该论文揭示了当前流行的in-context learning（基于上下文的学习）方法，即使用超大模型如GPT-3时遇到的一个关键问题——prompt（提示词）顺序对模型性能具有显著影响。传统的监督学习中，训练集的随机顺序对模型表现影响较小，但在in-context learning中，这个假设不再成立。作者们观察到，不同的prompt序列可以导致模型性能在最先进的水平和随机猜测之间大幅波动，且这一现象不受模型规模或样本数量的影响。这意味着，找到最优的prompt顺序并非易事，因为它既依赖于特定任务的上下文安排，又缺乏明确的规律。为了应对这个问题，论文提出了一种新颖的解决方案： 1. 验证集选择的局限：试图利用验证集来优化prompt顺序，但这样做实际上违背了in-context学习的核心理念，即利用较少的标签数据进行学习。这种方法可能导致模型过度拟合，偏离真正的少样本学习目标。 2. 预测标签偏差分析：作者注意到，无效的prompt顺序会导致模型生成的标签分布与实际分布偏差较大，这成为识别问题prompt的一个线索。 3. 无标签数据生成与评估：为了克服这一挑战，作者提出通过预训练语言模型生成无标签数据，将其作为新的验证集。他们采用预测标签分布的熵值作为评估指标，以此来挑选出最能促进模型准确性的prompt顺序。 4. 实验结果：这项创新策略在11个文本分类任务上实现了13%的相对性能提升，显示出其在解决in-context learning中prompt顺序问题上的有效性。这篇论文的重要性在于它揭示了一个重要的潜在问题，并提出了一个实用的方法来优化in-context学习过程，这对于依赖大规模模型进行少样本或无监督学习的领域具有深远影响。未来的研究可能会进一步探索如何更系统地理解和利用prompt的顺序以及如何设计更有效的策略来优化这一学习范式。

2023/6/28 17:14

ACL‘22杰出论文：Prompt范式有bug！

https://mp.weixin.qq.com/s/mgXEZgXyPfW5vg_6kigwmA

1/9

ACL‘22杰出论文：Prompt范式有bug！

收录于合集

#卖萌屋@自然语言处理

97个

文 | python

GPT-3等超大模型的兴起，也带来了 in-context learning （语境学习）的新范式。在语境学习

中，模型并不使用梯度下降，根据监督样本调整参数；而是将监督样本的输入输出接起来作为

prompt（提示词），引导模型根据测试集的输入生成预测结果。该方法的表现可以大幅超越零监

督学习，并为少样本监督学习提供了新的思路。

之前监督学习中的研究经验告诉我们，训练集随机打乱通常对模型表现不会有明显影响。然而，这

个结论在 in-context learning 下并不适用。作者发现，prompt中示例的顺序，对 in-context

learning 的表现有很大影响，可以让模型表现在state-of-the-art到随机之间波动。这一规律，

并不随着模型大小与样本量的多寡而变化。并且，较好的prompt样本的顺序，并没有规律可循。

那我们就无法选出最好的prompt顺序了么？作者表示，一方面，我们可以利用验证集来对prompt

的顺序做挑选。然而，这违背了 in-context learning 的少样本学习的初衷。另一方面，作者发现

大多数使模型失效的prompt顺序，会让模型预测的标签分布与真实分布有较大偏差。因此，作者

根据少量样本，基于预训练语言模型，生成无标签数据。以自动生成的无标注数据作为验证集，以

python 2022-07-10 12:05 发表于四川

原创

夕小瑶科技说

下载后可阅读完整内容，剩余8页未读，立即下载

普通网友

粉丝: 1277
资源:
5623

ACL'22论文揭示：prompt范式隐藏误导，顺序至关重要

探索ACL'22杰出论文：揭示Prompt范式潜在问题

JavaScript流程控制：if, if...else与prompt函数

SQLPrompt Toolbelt 10.12.3.28623版本更新支持SSMS v18

ACL‘22杰出论文：Prompt范式有bug！.rar

提示词工程师：高端Prompt——邮件撰写.pdf

提示学习Prompt Tuning：面向研究综述 - 知乎.pdf

从 ACL’22 投稿情况，速览当下 NLP 研究热点！ .pdf

ACL’22 _ 为大模型定制的数据增强方法FlipDA，屠榜六大NLU 数据集！.pdf

Pix2Seq：谷歌大脑提出 CV 任务统一接口！.pdf

json.decoder.JSONDecodeError: Expecting value: line 1 column 1 (char 0) bash: bash_prompt_command: command not found...

最新资源