揭示in-context学习真相：模型理解prompt的误解与机制

版权申诉

139 浏览量更新于2024-08-04 收藏 2.27MB PDF 举报

在现代自然语言处理领域，随着像GPT-3这样的大型预训练模型的出现，一种被称为in-context learning（上下文学习）的方法逐渐受到关注。这种技术允许模型在没有针对特定任务进行微调的情况下，通过提供上下文示例或prompt（提示）来理解和执行任务。in-context learning的关键在于，它不是通过调整模型参数来适应任务，而是依赖于模型在预训练阶段积累的通用语言理解能力。论文《Rethinking the Role of Demonstrations: What Makes In-Context Learning Work?》（arXiv:2202.12837）深入探讨了这种学习方式背后的机制。研究者发现，模型在in-context learning中的表现并非源自对输入与预期输出之间直接的关系的理解，而是更偏向于利用示例数据的形式和结构来激活其内在的模式识别能力。换句话说，模型可能并未真正“理解”prompt中的内容，而是通过模式匹配和统计推断来进行预测。论文强调了一个重要的观察：在meta-learning（元学习）的框架下，这种依赖于数据展示的特点更为显著。这意味着模型可能更多地依赖于示例数据的呈现方式，而非数据本身的意义，来生成预测。此外，论文还指出，由于标签的重要性被削弱，in-context zero-shot learning（无标签领域内的上下文学习）成为可能，这进一步扩展了模型应用的边界。为了验证这些理论，论文还提供了项目地址<https://github.com/Alrope123/rethinking-demonstrations>，供读者进一步研究和实践。in-context learning展示了在无需显式训练的情况下，如何巧妙利用模型的通用性来处理新任务，但同时也揭示了其局限性，即模型可能依赖于示例的表面规则，而非深层含义。这对于理解模型的工作原理、提高其泛化能力和未来发展方向具有重要意义。

2023/6/28 22:35

恕我直言，你的模型可能并没看懂 prompt 在说啥

https://mp.weixin.qq.com/s/qdCuPWsNg_lOxUkap1dQ9Q

1/10

恕我直言，你的模型可能并没看懂 prompt 在说啥

文  | pyt hon

前言

随着GPT-3等超大模型的兴起，in-context learning 的形式也流行起来。在in-context learning

中，模型不根据下游任务调整参数，而是将下游任务的输入输出接起来之后作为prompt，引导

模型根据测试集的输入生成预测结果。该方法的表现可以大幅超越零监督学习，并给大模型高

效运用提供了新的思路。

然而，in-context learning中，模型真的学习了下游任务么？作为prompt的训练样本，到底是

如何让模型work的？

本文作者发现，in-context learning学习的并不是输入与标注之间的关联，而是通过展示数据

形式，来激活预训练模型的能力。此外还有两个附带的结论：(1) 在meta learning的环境下，

in-context learning的这一特点更为明显；(2)因为标签不重要，所以可以用无标注领域内数据

做in-context zero shot learning。

论文题目：

Rethinking the Role of Demonstrations: What Makes In-Context Learning Work?

论文链接：

https://arxiv.org/abs/2202.12837

python 2022-04-15 12:05

原创

夕小瑶科技说

下载后可阅读完整内容，剩余9页未读，立即下载

普通网友

粉丝: 1283

揭示in-context学习真相：模型理解prompt的误解与机制

恕我直言，你的模型可能并没看懂 prompt 在说啥.rar

ChatGPT prompt指令模型大全.pdf

ChatGPT prompt指令模型大全-41页.pdf

sqlprompt-10.14.0.4064 下载

prompt learning 综述 pdf

用anaconda prompt跑模型

请用中文帮我写一个 基于prompt learning 的文本分类研究综述 的框架

你能解释prompt在模型训练中的应用和效果吗

怎么重启Anaconda Prompt

最新资源

请用中文帮我写一个基于prompt learning 的文本分类研究综述的框架