混合模型校准：边缘下面积与显著性在NLU任务中的应用

75 浏览量更新于2025-01-16 收藏 590KB PDF 举报

"本文主要探讨了混合边缘下面积和显著性在自然语言理解（NLU）任务中的模型校准方法，旨在改善深度神经网络模型的置信度与预测精度之间的匹配。作者SeoYeonPark和CorneliaCaragea来自伊利诺伊大学芝加哥分校，他们提出了一种新的混合策略，结合面积下的利润统计（AUM）和显著性图来提升预训练语言模型的校准效果。实验集中在自然语言推理、释义检测和常识推理等NLU任务上，结果显示，该方法能有效降低预期校准误差，同时保持高准确性。文章还比较了混合策略与传统的模型失配校正技术，如标签平滑和温度缩放，并对其影响进行了深入分析。" 混合边缘下面积和显著性的模型校准方法是针对深度神经网络（DNN）在NLU任务中过度自信问题的一种解决方案。过度自信可能导致模型在实际应用中给出过于确定的错误预测，这对诸如医疗保健和安全关键领域的应用是极为危险的。Guo等人（2017）的研究表明，DNN模型的置信度往往不能准确反映其预测的正确性。论文提出的新策略是结合两种统计方法：面积下的利润（AUM）和显著性图。AUM是一种衡量模型预测不确定性的统计量，而显著性图则通过计算梯度幅度来识别输入特征对模型预测的重要性。通过将这两种方法结合起来，论文旨在更精确地识别和处理模型的不确定性，从而实现更准确的校准。此外，论文还研究了传统校准技术如标签平滑和温度缩放的效果。标签平滑是一种数据增强技术，它通过模糊分类边界来减少模型的过拟合，而温度缩放则是通过调整模型的输出分布的“温度”来改进其置信度。论文对比这些方法与新提出的混合策略，揭示了每种方法对模型校准的具体影响。在实验部分，作者使用了三种不同的NLU任务来评估所提方法的有效性：自然语言推理、释义检测和常识推理。结果表明，所提出的混合策略在降低预期校准误差方面优于域内和域外的基准模型，同时保持了与基准模型相当甚至更高的准确性。这表明，这种混合策略能够提高NLU模型的可靠性，使其在实际应用中更加安全和可信赖。

+v：mala2277获取更多论

文

{}

∈

我

不

我

Mixup Mixup（Zhang et al. ，2018）是一种用

于数据增强的方法，其中在训练期间通过凸组

合随机对及其相关联的标签来生成附加样本

Verma

等人（

2019

）表明，操纵隐藏的表示而

不是操纵混合的输入级特征会产生更好的正则

化效果，因为它鼓励神经网络更多地关注低维

子空间中真实训练示例的表示。许多工作已经

从经验上注意到正则化效应可以提高深度神经

网络的模型性能。例如，Guo et al.（2019a）

通过在CNN和LSTM上使用句子和单词嵌入来

探索NLU特定的混合策略，以增加监督文本

分类的性能增益。

Chen et al.

（

2020

）提出了

半监督学习的

mixup

，其中标记和未标记的样

本用其隐藏表示进行插值，以提高文本分类的

性能。Zhang et al.（2020）探索了具有主动学

习的序列标记任务的混淆，以提高监督序列标

记任务的性能。 Yin 等人（ 2021 ）提出了

mixup

，在小批量中插入每个实例，以提高预

训练语言模型

RoBERTa

上的

NLU

任务的性能

（Liu et al. ，2019）。与我们相似，Yoon et

al. （2021）通过结合显着性信号来生成增强

样本来探索混淆。准确地说，他们使用显着性

信号从一个样本中选择一段文本，用另一个样

本中的另一段文本替换。然而，相比之下，我

们的方法首先根据它们的

AUM

将数据样本分为

两个类别（容易学习和难以学习/模糊类别）

（

Pleiss et al.

，

2020

）在训练时期内监测的差

异，然后使用显著性来找到这两个数据类别中

最相似

最不相似的样本。

最近，一些作品开始探索混淆

用于

NLU

模型校准。例如，

Thulasi-dasan et al.

（

2019

）研究了混淆对

NLU

模型校准的影响，

但仅探索了具有简单深度学习架构（如

CNN）的域内设置。 Kong等人（2020）探索

了使用mixup作为正则化的BERT校准

AUM（Pleiss et al. ，2020），并基于显著性

信号组合这两个集合上的样本，用于域内和

域外模型校准。

方法

3.1

Mixup

背景音乐让

其中

，

是

训练集，

是语言模

型。

Mixup training- ing

根据

Zhang

等人介绍的规

则生成邻近训练样本。（

2018

年）：

λx

（1

−

）

（1

）

λy

（1

−

）

其中

，

和

是两个随机采样的输入

点，

和

是关联的独热

编码标签，并且λ是从具有超

参数α的Beta（α，α）分布采样的混合比。在

混合中，通过在输入空间中线性插值训练样本

来增加训练数据

3.2

该方法

我们提出了一种旨在改善模型校准的混合方

法，该方法通过裕度下的面积（ AUM ）

（Pleiss et al. ，2020）和显着性（Simonyan et

al.

，

2013

）。

数据分类在我们的方法中，我们首先

根据每

个样本的AUM将训练分为两组（一组易于学

习的样本和一组难以学习/模糊的样本）给定

一个样本（

，

），我们计算

AUM

（

，

）作为在所有训练时期

上平均的裕度下

的面积

。具体地，在某个时期

t T

，裕度被定

义为：

（

，

）

−

max

！

（

）

（

）

其中M

（

，

）是具有黄金标签yi的示例xi的

裕度，z

是对应于黄金标签

的

logit

，并且max

！= k

（z

）是对应于不等于y

的

标签k的最大

其

它

logit。准确地说，保证金衡量的是黄金标签

与模型在每个时期的信念相比有多大的

所有时期的（

，

）的

AUM

为：

AUM（x

，

）

（x

，

）

（3

）

域内和域外的组件然而，他们的混淆方法仅仅

依赖于特征

i i

我我

样品之间的空间距离。相比之下，我们探索了

一种新的混合方法，在该方法中，我们使用

直观地说，具有高AUM 的样本易于学习

（模型的信念与黄金标签相

剩余12页未读，继续阅读

cpongm

粉丝: 6

混合模型校准：边缘下面积与显著性在NLU任务中的应用

cole_02_0507.pdf

工程硕士开题报告：无线传感器网络路由技术及能量优化LEACH协议研究

【东海期货-2025研报】东海贵金属周度策略：金价高位回落，阶段性回调趋势初现.pdf

图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程，简化了深度学习项目的数据准备工作)

diminico_02_0709.pdf

agenda_3cd_01_0716.pdf

A课件Python全栈开发线下班.zip

diminico_02_1108.pdf

基于人工智能大模型技术的果蔬农技知识智能问答系统.pdf

diminico_02_0307.pdf

最新资源