处理偏见：有偏见的互补标签学习与纠正

47 浏览量更新于2024-06-20 收藏 751KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

"有偏见的互补标签学习" 在机器学习领域，特别是分类问题中，获取大量准确的标注数据是至关重要的。然而，现实情况中，这种标注过程往往既费时又昂贵。为了解决这个问题，研究者们探索了使用不同类型弱监督信息的方法，比如有偏见的互补标签。互补标签指的是当真实标签不易获取时，我们可以得到部分或不完全正确的标签信息。这种标签可能是由于人为因素，如注释者的主观偏见或者知识局限，导致的错误标签。本文聚焦于有偏见的互补标签学习，这是一种特殊的弱监督学习形式。作者指出，之前的模型通常假设所有类别的互补标签（即非目标类）出现的概率是相同的，但这并不符合实际情况。例如，如果注释者对某一类别的物体更熟悉，他们可能会更容易将其他类别误标为这个熟悉的类别，如图1所示，注释者可能将“猴子”误标为“不是猫鼬”或“不是土拨鼠”。为了应对这一挑战，文章提出了一种新的框架，它包含以下三个主要创新点： 1. **估计无偏见的转移概率**：框架考虑了注释者偏见的影响，通过估计不同类别间的转移概率P(Y<sub>complement</sub>|Y=j)，来捕捉这种偏见。这允许模型更准确地理解互补标签的产生机制。 2. **修正损失函数**：传统损失函数在这种有偏见的情况下可能不再适用。因此，该框架提供了一种通用方法，可以修改标准的损失函数，使其适应有偏见的互补标签，从而改进深度神经网络分类器的学习过程。 3. **理论保证**：框架还提供了理论上的保证，证明使用互补标签学习的分类器能够收敛到使用真实标签学习的最优分类器。这是在保证模型性能的关键一步。通过在多个基准数据集上的实验，作者验证了他们的方法优于现有的最先进的技术，显示了其在处理有偏见互补标签数据时的有效性和优势。关键词：多类分类，有偏互补标签，转移矩阵，修正损失函数总结来说，这篇论文探讨了如何在面临注释者偏见的情况下，有效地利用有偏见的互补标签进行学习。提出的框架不仅考虑了偏见的影响，还提供了理论支持和实际性能提升，对于推动弱监督学习在深度学习中的应用具有重要意义。

资源详情

资源推荐

西于羽、刘铜梁、龚明明、陶大成

X × Y ×

{

···

}

X ∈Y

∈

∈ X ×

c−

∈/

在学习和转移学习中，方法[21，18，32，35]采用转移概率来修改损

失函数，使得它们可以对有噪声的标签具有鲁棒性。在[26，22]中已

经提出了通过添加过渡层来修改深度神经网络的类似策略然而，这是

第一次将这种想法应用于有偏见的互补标签学习的新问题。与标签噪

声不同，这里，转移矩阵的所有对角项都是零，并且转移矩阵有时可

能不需要在经验上可逆。

问题设置

在多类分类中，设

是特征空间，并且 =

[

]

是标

签空间，其中

是特征空间维度;

[c]

，，

;并且

2是类的数量。我们假设变量（

，

）在空间上定义

为

（

，

′

）（

′

）

。

实际上，真正的标签有时很昂贵，但补充标签很便宜。因此，这

项工作研究了这样一种设置，在这种设置中，我们有一个带有偏见的

互补标签的后者仅用于估计转移概率。我们的目标是学习最佳分类器

的例子与真正的标签，利用互补标签的例子。

对于一

个xample

（

，

）

，一个 comple

aryl

y ？

从该

comple

set

中

选择

我们

可以

轻松地找到可以选择的方式，即

：

例如

，

（

，

）

。

在

此版

本中，我们假设Y ¯s

是一个独立的可用的

turue

，

即

。

例

如

，

（

，

）

（

）

。

这是一

个简单

的概念

仅取决于类别的偏差，例如，如果注释者不熟悉

当她在一个特定的类的特征，她可能会分配互补的标签，她更熟

悉。我们将所有的概率归纳为

在

∈

处的转移m ，

其中

（

）

且d

，

∈

[

]

其中

，

Qij

表示Q的第i行和第j列中的条

目值注意

转移矩阵在马尔可夫链[7]中也得到了广泛的应用，并且在机器学习中

有许多应用，例如使用标签噪声进行学习[21，26，22]。

如果互补标记均匀地选自互补集合，则

，

[

]

和

，

。

以前的工作

[13]

已经证明，可以在均匀假设下找到最佳分类器。有

时，由于人类的偏见，这在实践中并不正确因此，我们关注Q

，

j不同的情况。我们主要研究以下几个问题：如何修改损失函

数，使得用这些有偏的互补标签学习的分类器可以收敛到用真实标签

学习的最优分类器;收敛的速度;以及如何估计转移概率。

方法

在本节中，我们将研究如何使用有偏见的互补标签进行学习我们首先

回顾如何从具有真实标签的示例中学习最佳分类器然后，

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

处理偏见：有偏见的互补标签学习与纠正

新闻报道“标签化”现象探析.zip

一种用于机箱散热并替代传统蒸汽压缩的系统.pdf

可以列举有哪些偏见吗？

有什么预训练模型时关于YouTube 推荐系统偏见的吗

再详细解释一下OrdinalEncoder()

独热编码是否总是比标签编码更好？

目前社会上存在着一种观点：尽管某些算法存在偏见，但与人类相比，其结果更加准确、更为公正。这似乎为有缺陷的算法的大规模应用找到了理由

人工智能中的性别偏见

辅助分类器 模型公平性

learning from failure: de-biasing classifier from biased classifier.

算法歧视与算法偏见的具体表现有哪些？

大数据时代数据偏见和歧视

Chatgpt可以完全代替人工作业吗

在adult数据集中实现Convert categorical variables to numerical values

第一性原理思维，归零，解构，重构，以跨越非连续性降本

Debiasing Recommendation by Learning Identifiable Latent Confounders讲解一下

youtube 推荐系统的 偏见

CNN中的归纳偏置是有用的吗

了解PDR、P2DR、PDR2、P2DR2以及WPDRRC各模型中每个部分的含义。这些模型的发展说明了什么？

课题研究过程可能遇到的问题

最新资源

辅助分类器模型公平性

youtube 推荐系统的偏见