能量模型新法：Mix&Match，实现可控文本生成

72 浏览量更新于2024-06-19 收藏 758KB PDF 举报

Mix and Match: 基于能量语言模型的可控文本生成新方法在当前的自然语言处理领域，随着大容量自回归语言模型（如Transformer架构）在海量数据上展现出强大的文本生成能力，如何确保生成的文本不仅自然流畅，还能满足特定的全局属性和约束成为了一项关键挑战。传统的文本生成控制方法通常依赖于两种策略：一是对基础语言模型进行属性相关的微调，二是对模型的参数化特性进行限制，使其与基础自回归模型兼容。然而，Fatemeh Sadat Mireshghallah, Kartik Goyal, 和 Taylor Berg-Kirkpatrick 提出了Mix and Match LM，这是一种创新的解决方案。这种方法不依赖于模型微调，而是利用预训练的黑盒模型作为能量源，用于指导文本生成过程。在Mix and Match LM中，控制属性如流畅性、特定风格或对特定情境的忠实度被看作是能量模型中的分量，通过线性组合形成一个综合的能量值。这个能量值被用作Metropolis-Hastings采样的依据，允许从基于能量的模型中采样出符合所需属性的文本。 Metropolis-Hastings算法在这里扮演了关键角色，它结合了上下文信息和全局属性特征，以确保生成的文本既能在上下文中保持连贯性，又能够体现所期望的属性。这种混合和匹配的方式避免了对黑盒模型进行深层次的调整，同时也避免了对模型形式的过度限制，从而保持了模型的灵活性和性能。作者们通过一系列的实验验证了Mix and Match LM在多个受控文本生成任务以及基于风格的文本修订任务中的有效性。结果显示，这种方法在保持生成质量的同时，相比现有涉及额外训练、微调或对模型结构假设的限制性方法，具有显著的优势，特别是在减轻模型潜在偏见和生成有害内容方面表现突出。 Mix and Match LM代表了一种突破性的思路，它通过灵活地整合预训练模型和采样策略，为实现更加可控且富有全局属性的文本生成提供了一种高效且易于实施的框架。这无疑为文本生成领域的研究开辟了新的可能性，也为解决语言模型中的伦理和安全问题提供了有力支持。

+v：mala2277获取更多论

文

∝

- -

独立训练的特定领域

专家

自回归语言模型。这

些方法需要定制模块的训练，并且不容易享受

以简单的概率方式将基于全局属性的特征并入

生成机制的益处相比之下，我们的基于能量的

公式不仅是无优化的，而且是完全模块化的，

并且能够容易地结合全局特征，允许异构的黑

盒专家彼此组合

混合匹配语言模型

在本节中，我们将描述我们的方法和方法背后

的具体而言，我们将执行受控发电的问题框定

为从专门的基于能量（或全局归一化）的序列

模型采样的问题，该序列模型定义了满足我们

希望在受控发电设置中施加的期望约束的概率

分布如下所述，该基于能量的模型由预先训练

的组件组成基于能量的序列模型定义了可能序

列空间上的概率分布

−

（

;

）

积极的情绪。如果我们可以访问两个单独的概

率分布，一个用于建模良好性（p

（X）），

另一个用于建模积极性（p

（X）），那么在

这种情况下，受控生成的自然解决方案将是从

概率分布中抽取样本，该概率分布是这两个分

布的乘积，即p

desire

（X）p

（X）。

在我们的方法中，我们进一步放宽了这一要

求，假设访问

专家黑盒

，产生标量非概率能量

分数

和

表明一个序列

w.r.t. well-formedness 格式 and positivity 积极

either分别.在上述专家框架的乘积下，期望的

概率分布将采取以下形式

：

（E

（X）

（X））对数Z该表达式表明，当使用

专家黑盒的标量分数时，专家模型的乘积产生

能量模型，该能量模型的能量仅仅是从专家模

型获得的标量能量值的总和。受此启发，我们

提出了一个框架，涉及各种黑盒专家的线性组

合，以获得一个分布，其样本满足所需的控制

生成的要求，

为：

（X;θ）

′

∈X

−

（

′

;

）

，其中

（

;

）

受控生成任务：E

M M

（X）

，

是指序列

的标量能量，

用θ表示。较低的能量对应于较高的X的可能

性。与常见的自回归序列模型相比，这些模

型的精确似然计算和有效采样具有挑战性。

尽管有这些挑战，我们专注于这种模式的序

列建模，因为基于能量的模型提供了更大的

灵活性，通过序列级的功能和约束。正如我

们接下来讨论的，这种能力让我们很容易定

义表达函数，用于控制序列的生成，这是自

回归建模范式不容易提供的

3.1

专家乘积能量模型与可控发电

我们的方法是出于这样一种观点，即受控生成

的任务需要在满足与流畅性、目标属性和其他

控制变量有关的各种约束的序列的小子空间上

集中概率质量。考虑生成积极情感句子的任

务。这需要满足两个主要的约束：（

）序列

应该是良构的，（

）序列

应该表示

[1]

为了简单起见，我们考虑的是一个有限的序列集，

该序列集受到某个最大长度的限制

我们提出的

混合搭配

能量是

由k

个

专家能量分量构成，这些专家能量分量由

标量超参数

加权。

3.2

混合搭配LM中的专家因素

如图 1，我们在实验中使用以下黑盒专家作为

模块，我们可以添加或删除它们以产生所需

的行为：E

mlm

（X）：最近的研究表明，

像BERT这样的掩码语言模型（MLM）可以

区分格式良好和格式不良的句子（Zhang et

al. ， 2020）并在序列上诱导隐式能量函数

（Goyal et al. ，2021年）。因此，我们使用

BERT

基作为一个黑盒来建模句子的形式和流

畅性具体而言，我们使用的能量参数化Goyal

等人。在步骤（

2021

）中，其是在掩蔽对应位置

之后在经由MLM的前向传递获得的每个位置处

迭代计算的未归一化对数的和的负值。

disc

（X）：这个特定的专家模块指的是通

过对感兴趣的属性进行分类获得的能量这个模

块返回的是目标属性的原始

logit

。例如，如果

我们有一个情感分类器，并希望产生积极的情

感，那么

disc

（

）

=−logp

（

+|X

）。

剩余14页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

能量模型新法：Mix&Match，实现可控文本生成

Mix-and-Match Tuning for Self-Supervised Semantic Segmentation

vue-mix-pages：基于vue2的多页+单页混合应用框架

react-native-mix-toast:基于React Native的Toast组件，完全实现Android轻提示和IOS提醒效果，可自定义toast视图和动画

arbok:基于Elixir角色的访问控制框架

Wind-Generator:基于Corcos模型生成多通道风噪声

Mix4U:基于模糊逻辑的音乐推荐

laravel-mix-favicon:Laravel Mix扩展可生成图标，并使用RealFaviconGenerator将HTML代码从单个PNGJPGSVG图像插入到Blade文件中

mix_generator:用于混合的项目生成器（替代新的混合器）

text-mix.js:文本块的平滑过渡

mix_and_match

最新资源