众包标记：批准投票与激励策略提升训练数据质量

59 浏览量更新于2024-06-18 收藏 1.83MB PDF 举报

"这篇论文探讨了众包环境中如何有效地收集训练数据，特别是针对机器学习模型的标记过程。文章指出，当前的众包平台存在工人激励与请求者需求不一致以及界面限制工人表达知识的问题。为解决这些问题，作者提出了采用批准投票的方式，允许工人对多个可能的正确答案进行投票，同时结合了严格的评分规则。这种方法旨在更好地利用工人的专业知识，并通过实证研究验证了其有效性。" 在机器学习领域，训练数据的质量和数量对于模型的性能至关重要。随着深度学习等技术的发展，对大规模标记数据的需求激增。传统上，这些任务由领域专家完成，但专家资源有限，限制了数据集的规模。因此，众包平台如Amazon Mechanical Turk成为了数据标注的主要来源，使得非专家的普通用户也能参与到这项工作中。然而，众包环境存在两个主要问题。首先，工人的激励机制往往与请求者（即需要数据的个人或公司）的目标不完全匹配。工人可能更倾向于快速完成任务而非提供高质量的标签，而请求者则希望获取最准确的数据。其次，现有的众包平台界面设计往往要求工人从一组排他性的选项中选择一个答案，这可能无法充分反映工人对问题的真实理解，尤其是当答案不明确时。为了解决这些问题，该论文提出了一种基于批准投票的新方法。在这个框架下，工人可以对认为正确的多个选项进行投票，而不是仅仅选择一个。这种策略允许工人表达他们对问题的不确定性和部分知识，提高了信息的完整性。同时，论文引入了两个严格适当的评分规则，确保了工人的贡献能够得到公正的评估和奖励，从而更好地对齐工人的激励与请求者的期望。论文还进行了实证研究，使用Amazon Mechanical Turk平台进行了实验，结果显示，批准投票结合适当的评分规则确实能提高数据质量，验证了该方法的有效性。此外，这一方法还有潜力优化众包平台的效率和满意度，对于推动机器学习模型的训练和改进具有重要意义。这篇论文为解决众包数据标注问题提供了一个创新的解决方案，强调了在众包环境中如何更好地利用非专家的知识，并通过批准投票和适当的激励机制来改善数据质量。这不仅有助于提升机器学习模型的性能，也为未来众包平台的设计提供了有价值的理论基础和实践指导。

十

三：

N. B. Shah和D.周

ACM Transactions on Economics and Computation，卷。号83、第十三条。出版日期：2020年6月

≥ ···≥

联系

我们

∈

⎩

4=1

第

四章

（四

）

⎭

⎩

第

四章

（四

）

⎭

而不选择选项

∈

[B] |p

<σ}。（3b）

然后，我们的目标是设计激励这种行为的支付机制

定义

（绝对持牌的严格适当评分规则）。

支付函数是绝对阈值的严格适当的评分规

则，如果从工人的角度来看，当她选择集合（3a）中的所有选项而不选择集合（3b）中的

任何选项时，她的期望支付（2）

工人被允许为她的信念正好是σ

的选项

采取任何一种方式。当工人对某个选项的信念等

于σ时，我们不从评分规则中强加要求

我们在第

节中讨论了绝对阈值的设置。

2.3.2

相对稳定。

考虑以下两个关于工人对于B = 10个选项的问题的信念的场景：场景

I：信念是（1/4，1/4，1/16，.，1/16）;情景II：信念是（2/3，1/3，0，.，0）。然后，在场

景I中，人们可能希望让工人选择前两个选项，因为其他选项的概率很低。在情景II中，人

们可能希望工人选择第一个选项，但不选择第二个选项，因为第一个选项和第二个选项的

信念之间存在显著差异。但是，第2.3.1节中设置的固定绝对阈值σ不能同时满足这两个要

求。因此，在本节中，我们考虑一个基于相对阈值的替代要求：工人被激励逐个选择选

项，当且仅当它对相对于已经选择的选项的信念有足够的贡献时才选择选项。

形式上，要求与预先指定的值ρ（0， 1）相关联。考虑任何问题i[N]。设（1），.，

（B）表示B选项的排序，使得工人对问题i的信念遵循此顺序，即，pi（1）pi

（B），其中工人任意断开联系。然后，我们希望工人精确地选择选项集

⎧

⎪

⎨

⎪

∈

[

]

（

）

，

（

）

⎧

⎪

⎨

⎪

∈

[

]

（

）

。

（4b项）

换句话说，在选择了最有可能的选项之后，只要所选选项对所选选项的总信念的贡献比ρ

大一小部分，则必须按照信念的降序逐个选择剩余选项。例如，本小节前面描述的两种情

况都可以通过选择ρ = 0来同时适应。4.请注意，正如在绝对阈值的设置（第2.3.1节）中一

样，如果公式（4）中置信度的相对值正好等于ρ

，则

我们不施加任何要求。

定义

（严格正确的评分规则相对控股）。

支付函数是相对阈值化的严格适当的评分规

则，如果从工人的角度来看，当她对每个问题i ∈ [ N ]选择集合（4a）中的所有选项而不

选择集合（4b）中的任何选项时，期望支付（2）

我们在第

节中讨论了相对阈值的设置。

众包中的批准投票和激励

十

三：

ACM Transactions on Economics and Computation，卷。号83、第十三条。出版日期：2020年6月

∈

「

−||−

{ ≥}

∈

−

| −

联系

我们

−

绝对阈值

在本节中，我们考虑激励工人选择所有选项的设置，对于某个固定参数σ（0

，

1），她的

信念严格大于σ，如2.3.1节所述。在继续之前，我们必须详细说明问题设置的某些迂腐细

节。让我们定义两个整数s

min

和s

max

为s

min

1{σ

}

和s

max

min{考虑任何问题。

注意，如果

B σ

，那么让工人选择零个选项是没有意义的，因为至少有一个选项的

信念必须是

或更高。还可以观察到，对于任何σ

∈

（0，1）的值，它是

允许工人选择一个或多个选项是没有意义的，因为从数学上讲，这些选项的概率不可

能超过

。因此，我们将强制工人为任何问题选择至少

min

和最多

max

选项让

，

表示工人对

黄金标准问题的回答的评价（回忆

2.1

节），因此目标是设计支付函数

（

，

）时，

|∈

{

min

，

smax

}

。最后，我们注意到，如果

或如果

≥

，则该

设置退化为

Shah

和

Zhou [ 55 ]

中研究的因此，我们在本节中考虑区域

≥

且

∈

（

，

）。

3.1 建议评分规则

我们提出的用于设置本节的评分规则被提供为评分规则1。为了便于记法，我们将该评分规

则表示为f

。

评分规则1：绝对阈值

•

输入：对G金标准问题答案的评估（x

，

，x

）

•

输出：付款

（

，

）

（

B x

）

1 x

min

，

其中k

max

−

min

（（B−2）σ

1）

让我们来解释一下这个评分规则。对于任意问题

i [G]

，分量（

B x 1

）

的评分规则

对选择错误的选项惩罚

，对选择正确的选项奖励

。总的付款

是这些成分的产物

回答所有黄金标准问题。常数

仅用于调整支付以适应（

min

，

max

）要求。

下面的定理现在证明了与我们的评分规则相关的保证

第3.1节.

考虑任意

∈

（0，1）

，

N ≥ G ≥ 1

，

B ≥ 3.

那么，评分规则

是严格适当的

绝对阈值。

这个结果的证明首先计算出在诚实响应的情况下的期望支付，然后通过一些代数论证表

明，每隔一个响应必须导致严格较小的支付。本节的其余部分将专门讨论这一证明。

THEOREM 3.1

的

屋顶在不失一般性的情况下，假设

min

，因为评分规则的性质是

严格适当的，对于任何恒定的移位和支付的正标度都是不变我们采用简洁的符号

：

max

min

。还记得术语

剩余44页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

众包标记：批准投票与激励策略提升训练数据质量

在解决OCR验证码问题时，没有足够的标记数据，如何低成本获得标记数据

数据驱动众包设计场景建模

数据驱动的众包设计场景建模

自己爬取的数据如何标注

智慧消防的O2O众包用工系统专利的关键点和保护点内容是什么，请详细阐述

训练自己的关键点检测数据集

众包数据库 crowddb

车辆众包概述 纤细介绍

众包设计场景中的元素建模

由于传统的位置隐私保护机制假设在不考虑车辆网络约束的情况下，工人在二维平面上的移动。和现在基于车辆的空间众包中的位置隐私保护比较 缺点在哪

最新资源

车辆众包概述纤细介绍

由于传统的位置隐私保护机制假设在不考虑车辆网络约束的情况下，工人在二维平面上的移动。和现在基于车辆的空间众包中的位置隐私保护比较缺点在哪