在线知识市场的规模困境

140 浏览量更新于2023-10-16 收藏 13.75MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

650规模困境：为什么在线知识市场在规模上可能失败0Himel Dev伊利诺伊大学（UIUC）hdev3@illinois.edu0Chase Geigle伊利诺伊大学（UIUC）geigle1@illinois.edu0Qingtao Hu伊利诺伊大学（UIUC）qhu13@illinois.edu0郑佳慧北京大学alicehz@pku.edu.cn0Hari Sundaram伊利诺伊大学（UIUC）hs1@illinois.edu0摘要0本文将StackExchange平台上的社区问答网站解释为知识市场，并分析这些市场在规模上如何以及为什么可能失败。知识市场的框架使网站运营商能够思考市场失灵，并设计政策来防止失灵。我们的目标是通过可解释的模型提供关于大规模知识市场失灵的见解。我们在大型实证数据集上探索了一组可解释的经济生产模型，以分析知识市场中内容生成的动态。在这些模型中，Cobb-Douglas模型最能解释实证数据，并通过弹性和递减收益的概念对内容生成提供了直观的解释。内容生成取决于用户参与以及特定类型的内容（例如答案）取决于其他类型（例如问题）。我们展示了内容生成的这些因素具有恒定的弹性-任何输入的百分比增加都会导致输出的恒定百分比增加。此外，市场表现出递减收益-随着输入的递增增加，边际产出减少。知识市场的规模回报也有所不同-输出的增加是由于所有输入的成比例增加。重要的是，许多知识市场表现出规模的不经济性-市场健康度的度量（例如具有接受答案的问题的百分比）随参与者数量的增加而减少。我们的工作有两个方面的影响：网站运营商应根据系统规模（参与者数量）设计激励措施；市场视角应为一般社交网络中不同内容类型和参与者行为之间的复杂依赖关系提供洞察力。0CCS概念0• 信息系统 → 数据挖掘；社交网络；0关键词0社区问答；知识市场；内容生成；规模的不经济性0本文发表在知识共享署名4.0国际许可证（CC BY4.0）下。作者保留在个人和公司网站上传播作品的权利，并附上适当的归属。WWW2018，2018年4月23日至27日，法国里昂，© 2018IW3C2（国际万维网会议委员会），根据知识共享CC BY 4.0许可证发布。ACM ISBN978-1-4503-5639-8/18/04。https://doi.org/10.1145/3178876.31860370ACM参考格式：Himel Dev，Chase Geigle，Qingtao Hu，JiahuiZheng和HariSundaram。2018年。规模困境：为什么在线知识市场在规模上可能失败。在WWW2018：2018年网络会议，2018年4月23日至27日，法国里昂。ACM，美国纽约，11页。https://doi.org/10.1145/3178876.318603701 引言0本文通过市场的经济视角分析了StackExchange网络上的大量社区问答（CQA）网站。将StackExchange网站框架化为知识市场具有直观的吸引力：在一个假设的知识市场中，如果没有人愿意回答问题，只愿意提问，或者反过来，有人只愿意回答而不提问，那么“市场”将会崩溃。那么，在这样一个知识市场中，行动之间（比如问题和答案之间）的关系应该是什么样的，我们才能认为它是健康的？更多参与者的大型市场是否更健康，因为会有更多的人提问和回答问题？通过经济视角研究CQA网站使网站运营商能够思考是否应该扩大用户群体。由于大多数流行的CQA网站（例如Quora、StackExchange）不向参与者收费，而是依靠网站广告获取收入，因此这些网站的运营商自然而然地希望扩大用户群体，以增加收入。正如我们在本文中所展示的，对于大多数StackExchange网站来说，用户群体的增长是适得其反的，因为它们变得不健康-特别是更多的问题没有得到回答。解释知识市场的宏观行为是重要的，但也具有挑战性。可以将某些感兴趣的变量（比如问题数量）回归到包括用户数量、在网站上花费的时间等变量上。然而，解释回归曲线为什么看起来是这样的是困难的。正如我们在这项工作中所展示的，使用市场的经济视角可以模拟参与者数量和内容数量之间的依赖关系，并预测内容的生成。我们的主要贡献是将CQA网站建模为知识市场，并提供关于这些市场规模和健康之间关系的见解。为此，我们开发了模型来捕捉知识市场中内容生成的动态。我们分析了一组基础函数（输入对输出的功能形式）和交互机制（输入如何相互作用），并使用输出（问题、答案和评论）上的预测任务确定最佳的幂基函数和交互基本交互形式。0Track: 众包和人类计算的Web WWW 2018年4月23日至27日，法国里昂Our work draws from, and improves upon, several research threads.Sustainability. Srba and Bielikova [35] conducted a case studyon why StackOverflow, the largest and oldest of the sites in StackEx-change network, is failing. They shed some insights into knowledgemarket failure such as novice and negligent users generating lowquality content perpetuating the decline of the market. However,they do not provide a systematic way to understand and preventfailures in these markets. Wu et al. [41] introduced a framework forunderstanding the user strategies in a knowledge market—revealingthe importance of diverse user strategies for sustainable markets.In this paper, we present an alternative model that provides manyinteresting insights including knowledge market sustainability.Activity Dynamics. Walk et al. [39] modeled user-level activitydynamics in StackExchange using two factors: intrinsic activity660这种形式是众所周知的柯布-道格拉斯形式，将生产投入与产出联系起来。使用每个StackExchange网站的最佳模型拟合，我们展示了柯布-道格拉斯模型对内容生成的高准确性预测。柯布-道格拉斯函数为StackExchange市场中的内容生成提供了直观的解释。它表明，在StackExchange市场中，（1）用户参与和内容依赖等因素具有恒定的弹性，任何这些投入的百分比增加都将导致产出的百分比增加；（2）在许多市场中，因素呈现递减收益，即在保持其他投入不变的情况下，边际（增量）产出（例如回答产出）随着输入（例如回答者数量）的递增而递减；（3）市场根据规模的回报率而有所不同，即所有投入成比例增加导致产出的增加；（4）许多市场表现出规模的不经济性，即健康度的度量随整体系统规模（参与者数量）的增加而降低。我们之所以看到StackExchange市场呈现递减收益的原因有两个。首先，任何StackExchange市场的参与者总活动显然遵循幂律分布。有趣的是，大多数市场的幂律指数随规模增加而下降，这意味着新用户的参与方式与早期用户不同。其次，我们可以确定一群稳定的核心用户，他们长时间积极参与，为市场的健康做出贡献。最后，我们通过对系统规模的实验、健康度指标的分析和用户可交换性进行了规模经济性的实验。对于大多数StackExchange市场，我们发现随着系统规模的增长，回答问题的比例低于临界点，导致一些问题无人回答。此外，使用接受答案的问题数量和至少有一个答案的问题数量的健康度指标，我们观察到大多数StackExchange市场在规模增加时健康度下降。最后，我们将顶级贡献者与底部贡献者进行比较，看他们是否“可交换”。大多数StackExchange市场在贡献者的贡献上是不可交换的，即顶级贡献者和底部贡献者的贡献在质量上有所不同，并且在绝对值上也有所不同。这些关于规模经济性的实验与柯布-道格拉斯生产模型的洞察力一致，该模型预测了递减收益。02 相关工作0衰减和积极的同伴影响。然而，该模型并未揭示集体平台动态以及平台的最终成功或失败。Abufouda[1]提出了两个模型，用于预测在线社交社区中社区成员互动的衰减。与Walk等人[39]类似，这些模型适应用户级别的动态，而我们则关注集体平台动态。Wu和Zhang[42]提出了一种离散广义贝塔分布（DGBD）模型，揭示了集体平台动态的几个见解，尤其是大小相关分布的概念。在本文中，我们改进了大小相关分布的概念。经济视角。Kumar等人[24]提出了CQA平台的经济视角，他们关注市场环境中两类用户的增长：提问者和回答者。在本文中，我们关注一个后续问题——用户增长与知识市场中内容生成之间的“关系”。Butler[9]提出了可持续社会结构的基于资源的理论。虽然他们将成员视为资源，与我们的模型相似，但我们的模型不同之处在于它关注的是市场环境，而不是网络环境，并且考虑了平台复杂的内容依赖关系。此外，我们的模型提供了一种系统的方法来理解知识市场的成功和失败，而这些模型都没有提供。规模研究。Lin等人[27]研究了Reddit社区，以表征用户增长对投票模式、语言模式和社区网络模式的影响。他们的研究发现，在用户社区规模大幅增长后，这些模式并没有发生太大变化。Yla等人[44]研究了群体规模对StackExchange社区中解决方案质量的影响。他们的研究揭示了群体规模对解决方案质量的三个不同层次的影响：主题受众规模、问题受众规模和贡献者数量。在本文中，我们通过使用一组健康度指标从不同的角度研究了规模对知识市场的影响。稳定性。平台的成功和失败已经从用户保留和稳定性的角度进行了研究[12, 16, 22,30]。值得注意的是，Patil等人[30]研究了基于成员增长的平均增加或减少来研究群体稳定性的动态。我们的论文通过考虑用户的相对可交换性作为规模函数来研究稳定性，采用了一种不同的方式。用户增长。用户社区的成功和失败也广泛研究了用户增长的角度[6, 21, 25,32,45]。Kairam等人[21]研究了扩散和非扩散增长，设计了预测社交群体寿命的模型。Ribeiro[32]提出了一种每日活跃用户预测模型，将会员制网站分类为可持续和不可持续的。虽然这个角度很重要，但我们认为基于内容生成来研究社区的成功和失败可能更有意义[23, 47,48]。CQA网站建模。有大量的研究对CQA网站进行了广泛的分析[3,5, 10, 34, 40]，以及用户行为[4, 19, 31, 38, 46]、角色[15,26]和内容生成[7, 14,43]。值得注意的是，Yang等人[43]指出了CQA的可扩展性问题，即问题的数量最终超过了社区回答者的能力。理解和建模这一现象是本文的目标之一。0Track: Crowdsourcing and Human Computation for the Web WWW 2018, April 23-27, 2018, Lyon, France6703问题建模0本文的目标是开发一个知识市场内容生成模型。内容对于知识市场的成功与失败至关重要。因此，我们的目标是更好地理解内容生成的动态。内容动态模型应具备以下特性：宏观规模、解释性、预测性、简约性、全面性。宏观规模：模型应通过综合指标捕捉内容生成动态。综合指标有助于我们通过总结有关个体的复杂信息来理解集体市场，这对于制定政策至关重要。解释性：模型应对知识市场的行为有洞察力。了解市场行为是设计维持一个有弹性、可持续的市场的关键第一步。预测性：模型应允许我们对未来的内容生成和结果的成功或失败进行预测。这些市场预测对于预防和减轻市场失败至关重要。简约性：模型应具备尽可能少的参数，同时仍然能够紧密反映观察到的现实情况。全面性：模型应涵盖不同内容类型（例如问题、答案、评论）在各种知识市场中的内容生成动态。这对于开发系统性地理解知识市场的成功和失败至关重要。在接下来的章节中，我们提出满足上述要求的模型，并展示我们最佳拟合模型如何准确反映现实世界知识市场的内容生成动态和结果的成功与失败。04建模知识市场0在本节中，我们引入经济生产模型来捕捉现实世界知识市场中的内容生成动态。我们首先对经济生产和内容生成进行类比，并报告知识市场中的内容生成因素（第4.1节）。然后，我们专注于StackExchange中的知识市场，提出不同内容类型的生产模型（第4.2节）。04.1初步0经济生产机制很好地描述了知识市场中的内容生成。在经济学中，生产被定义为人类劳动通常在工具和其他形式的资本的帮助下应用的过程，以生产有用的商品或服务-产出[36]。我们断言，知识市场的参与者作为劳动力生成诸如问题和答案之类的内容。类似于经济产出，内容对参与者的效用有所贡献。受到生产类比的启发，我们设计了宏观经济生产模型，以捕捉知识市场中的内容生成动态。在这些模型中，我们不是直接将内容生成建模为动态过程（时间函数），而是将其建模为与动态因素相关的过程。0影响知识市场内容生成的两个关键因素是用户参与和内容依赖性。用户参与是决定生成内容数量的最重要因素。在知识市场中，参与更多用户会产生更多问题、答案和其他内容。内容依赖性也影响不同类型的生成内容的数量。内容依赖性是指一种内容（例如答案）对另一种内容（例如问题）的依赖。在没有问题的情况下，即使存在许多愿意回答的潜在参与者，知识市场中也不会有答案。04.2建模StackExchange0StackExchange是一个社区问答网站网络，每个网站都基于一个专注的主题。StackExchange网络的每个用户根据自己的兴趣参与一个或多个这些网站。StackExchange网站是自由知识市场，参与者通过非货币声誉激励生成内容。这些市场是多样化的，主题（主题内容）、规模（用户数量和活动量）和年龄（存在的天数）各不相同。我们为StackExchange中的三种主要内容类型设计了生产模型：问题（根内容）、答案（嵌套在问题下方）和评论（可以嵌套在问题或答案下方）。根据内容依赖性和内容生成中的用户角色，我们提出了以下关于问题、答案和评论在StackExchange中生成的关系（请参见表1中的符号表示）。0表1：模型中使用的符号0符号定义0U q ( t ) 在时间 t 提问问题的用户数量 U a ( t ) 在时间 t回答问题的用户数量 U c ( t ) 在时间 t 发表评论的用户数量 N q( t ) 在时间 t 活跃问题的数量 N a ( t ) 在时间 t对活跃问题的回答数量 N q c ( t ) 在时间 t对活跃问题的评论数量 N a c ( t ) 在时间 t对活跃答案的评论数量 N c ( t ) 在时间 t对活跃问题/答案的评论数量 f x 内容类型 x 的函数关系0生成 N q 问题有一个关键因素：提问问题的用户数量 Uq（提问者）。0N q = f q (U q)0生成 N a 答案有两个关键因素：问题数量 N q和回答问题的用户数量 U a（回答者）。N a = f a (N q, U a)评论有两种类型：对问题的评论和对答案的评论。因此，在生成 N c评论时有三个关键因素：问题数量 N q，答案数量 N a和发表评论的用户数量 U c（评论者）。N q c = f c q (N q, U c)0Track: Crowdsourcing and Human Computation for the Web WWW 2018, April 23-27, 2018, Lyon, Francey11y1y10.00.20.40.60.81.0680N a c = f c a (N a,0N c = N q c + N a c上述关系意味着每种类型的生成内容量取决于描述其因素相关增长的函数和因素的可用性。这些关系做出了三个假设。首先，不同的内容类型仅通过它们对因素的使用进行交互。其次，功能关系取决于每个因素的消耗或使用。第三，功能关系取决于因素之间的相互作用，即特定内容类型的因素如何相互作用。现在，我们通过首先选择一个基础函数来捕捉给定因素对特定内容类型的影响，然后选择一个交互类型来捕捉因素之间的相互作用，将功能关系转化为生产模型。基础函数。我们使用基础函数来捕捉给定因素对特定内容类型的影响。虽然在回归中有各种各样的基础函数可用，但我们考虑经济学和增长建模中广泛使用的三种基础函数[13]：幂函数—д(x) = axλ；指数函数—д(x) =abx；和S形函数—д(x) = L01 + e k ( x − x 0 ) .因素之间的相互作用。我们使用一个聚合函数来捕捉给定内容类型的多个因素之间的相互作用。具体来说，我们考虑表2中列出的两两交互函数。我们将基础函数和交互类型结合起来，为不同的内容类型设计生产模型。例如，可以使用幂基础和基本交互来建模答案生成，如N a = min(a 1 N λ 1 q, a 2 U λ 2a)。我们在StackExchange中为答案和评论生成考虑了12种可能的模型（三种基础和四种交互类型的组合）。用户角色分布。我们模型的一个基本假设是用户角色（例如，提问者、回答者和评论者）及其分布（例如，有多少用户是提问者）的意识。我们经验性地观察到所有的StackExchange市场都有一个稳定的用户角色分布。事实上，根据用户数量，我们可以准确地预测每个角色的参与者数量。我们应用线性回归来确定StackExchange市场中特定角色 x ∈ {q, a, c}的参与者数量 U x 从用户数量 U。对于每个市场，我们计算三个不同的确定系数 R 2，用于使用线性回归预测三个角色（提问者、回答者和评论者）。在图1中，我们展示了在156个StackExchange市场上回归用户角色的 R2的分布。我们使用字母值图1来展示这些分布，显示它们尾部行为的精确估计。我们观察到，在大多数市场中， R 2值接近1。此外，捕捉低 R 2值的尾部包括月度用户数量相对较少的市场。用户数量。用户数量是我们内容生成模型的唯一自由输入；其余输入是用户数量的函数。在所有这些模型中，用户数量的增长或下降是外生的，由非经济力量决定。01字母值图显示了有关变量分布的信息[20]。它使用字母值传达了尾部行为的精确估计；箱线图缺乏这种精确估计。0表2: 因素之间的等高线配对交互0基本:基本因素对于内容生成都是必需的，单个因素的边际回报为零。对于一对基本因素，内容生成由限制性更大的因素决定：z =min(y1, y2) [37]。这被称为李比希的最小法则。0 1 2 3 4 50z = 10z = 20z = 30z = min(y1, y2)0交互基本: 在交互基本交互中，单个因素的回报是递减的（而不是零回报）：z = y1y2 [37]。如果使用幂函数来消耗因素，即yi= axλi，它捕捉到了科布-道格拉斯生产函数。0 1 2 3 4 50z = 10z = 20z = 30对抗性: 对于对抗性因素，内容生成仅由产生最大回报的因素的可用性决定：z = max(y1, y2)[37]。这种交互意味着生产过程具有最大的可能效率。0 1 2 3 4 50z = 50z = 40z = 30z = max(y1, y2)0可替代性: 单独支持生产的因素相对于彼此是可替代的：z = w1y1 + w2y2[37]。这意味着两个因素之间存在某种等价性。这类似于一般的加法模型。0 1 2 3 4 50z = 10z = 30z = 50回答者提问者评论者0决定系数,R 20图1:在156个StackExchange网站上回归用户角色的决定系数R2的分布。在大多数StackExchange网站上，角色分布是稳定的，如字母值图所示。05 数据集0我们收集了StackExchange数据集的最新版本（2017年9月）。这个快照是StackExchange网站上所有活动的完整存档。我们收集的数据集中有169个网站。0Track: Crowdsourcing and Human Computation for the Web WWW 2018, 2018年4月23日至27日，法国里昂1011021031041051061031041051061Tˆ2RMSETrack: Crowdsourcing and Human Computation for the WebWWW 2018, April 23-27, 2018, Lyon, France690为了进行实证分析，我们只考虑那些在“启动期”（网站创建后，但几乎没有活动）之后至少活跃了12个月的网站。这样的网站有156个。这些网站的年龄从14个月到111个月不等，用户数量从1,072到547,175，帖子（问题和答案）数量从1,600到1,985,869。此外，这些网站的用户群体之间有很小的重叠；因此，我们可以合理地认为这些基础市场是独立的。0月份数量0用户数量0帖子数量0图2:156个StackExchange网站的月份数量（年龄）、用户数量和帖子数量的对数刻度分布。0在图2中，我们以对数刻度呈现字母值图，展示了156个StackExchange网站的月份（年龄）、用户数量和帖子数量的分布。06 评估我们提出的模型0在本节中，我们根据我们数据集中观察到的内容生成时间序列的拟合准确性，确定最佳模型（基础模型和交互模型），并评估最佳模型在长期预测内容量方面的性能（第6.2节）。06.1 模型拟合0我们将每个生产模型的变体（基础和交互）分别适配到每个StackExchange网站中观察到的内容生成时间序列（月度粒度）中。请注意，在不同变体的生产模型中，使用幂函数或指数函数基础的模型具有简洁的参数集。例如，使用幂函数基础的回答生成模型仅需要三个参数来进行交互式必要交互（参见第4.2节），以及其他交互类型需要四个参数。相比之下，使用S型函数基础的回答生成模型需要五个参数来进行交互式必要交互，以及其他交互类型需要六个参数。参数估计。我们学习最佳拟合参数来捕捉观察到的内容生成时间序列。我们将生产模型的某些参数限制为非负数，例如幂函数中的非负指数。这些限制很重要，因为底层因素对输出产生积极影响。我们使用信赖区域反射算法[8]来解决我们的受约束最小二乘优化问题。该算法适用于带约束的非线性最小二乘问题。0评估方法。我们使用四个指标评估拟合精度：均方根误差（RMSE），归一化均方根误差（NRMSE），解释方差得分（EVS）和阿卡伊克信息准则（AIC）。对于每种内容类型的两个序列，观察序列N(t)和模型带有k个参数的序列的预测ˆN(t)，我们计算四个指标如下：0T � T t = 1 ( N ( t )− ˆ N ( t )) 2 ) + 2 k.在这四个指标中，RMSE和NRMSE是误差指标（值越低表示拟合效果越好），AIC是信息理论指标，用于捕捉模型复杂性和拟合效果之间的权衡（值越低表示模型越好），而EVS指的是模型捕捉数据方差的能力（值越高表示模型越好）。拟合结果。我们使用这四个指标比较所有StackExchange网站的生产模型的拟合精度。每种指标都通过每种内容类型的所有网站的均值进行总结。我们使用月度粒度的内容生成时间序列作为观察数据。我们发现指数函数和S型函数基础的模型无法拟合许多StackExchange网站的数据。因此，在表3中，我们仅呈现具有幂函数基础和不同交互类型的生产模型的结果。请注意，具有交互式必要交互的模型在所有指标和内容类型上优于其他模型。我们进行了配对t检验，以确定交互式必要交互的改进是否具有统计显著性；结果为p < 0.01。0表3：所有StackExchange网站生产模型（使用幂函数和不同交互类型）的拟合精度比较。对于所有指标和内容类型，具有交互式必要交互的模型优于其他模型。交互式必要交互的改进在统计上是显著的，通过配对t检验进行验证，其中p < 0.01。0内容交互平均平均平均平均类型 RMSE NRMSE EVS AIC0问题单因素 25.74 0.09 0.79 104.470回答0必要 70.31 0.09 0.79 208.82 I. 必要 64.62 0.080.83 196.39 对抗性 72.77 0.09 0.78 210.96可替代 68.90 0.09 0.81 207.610评论0必要 146.64 0.08 0.83 328.25 I. 必要 137.23 0.080.85 318.24 对抗性 155.97 0.09 0.82 334.12可替代 155.43 0.09 0.82 335.100因此，我们使用具有幂基础和交互基础交互的生产模型进行预测任务。06.2 预测内容生成0year ahead in the future. Specifically, we train each model usingthe content generation data from the first 12 months (beyond theramp period), and then examine how well the model forecasts con-tent dynamics in the next 12 months. We validate the forecastingcapability by examining the overall prediction error (NRMSE).We compute the prediction NRMSE across all StackExchangesites, and summarize the results using the mean (µ) and variance(σ)— (i) question: µ = 0.11, σ = 0.08; (ii) answer: µ = 0.12, σ = 0.09;(iii) comments: µ = 0.11, σ = 0.10. Notice that our models canforecast future content dynamics with high accuracy. We performedthese experiments for different time granularity, e.g., week, month,quarter, and reached a consistent conclusion. We do not reportthese results for brevity.1000500-1.8-1.6-1.4-1.2-1.0-0.820050 12005001707007 描述知识市场0在本节中，我们描述了StackExchange中的知识市场。我们解释了最佳拟合模型及其基础（第7.1节），揭示了控制市场的两个关键分布（第7.2节），并揭示了维持市场均衡的稳定核心（第7.3节）。07.1 模型解释0首先，我们解释了在第6.1节中发现的最佳拟合模型。我们观察到StackExchange市场中的内容生成最适合通过幂基础和交互基础交互的组合来建模。此外，我们发现这些模型的最佳拟合指数（基础函数中的λ参数，其中x是一个因子）介于0和1之间（包括0和1），适用于所有内容类型的所有因子，适用于所有StackExchange市场。使用幂基础（指数介于0和1之间）和交互基础交互的模型被称为Cobb-Douglas生产函数[18]。在其最标准的形式中，用于单一输出z和两个输入x1和x2的生产函数为：0z = axλ11xλ22.0这里，系数a代表总要素生产率-在生产中未被输入量解释的产出部分[18]。因此，其水平由输入在生产中的有效利用程度决定。指数λi代表输入的产出弹性-特定输入的百分比变化导致的产出百分比变化[18]。Cobb-Douglas函数为StackExchange市场中的内容生成提供了直观的解释。特别是，解释基于三个现象或原则：恒定弹性、递减收益和规模收益。恒定弹性。在StackExchange市场中，用户参与和内容依赖等因素具有恒定弹性-任何这些输入的百分比增加都将导致产出的恒定百分比增加[18]，正如模型中相应的指数所述。例如，在学术界（Na=6.93N0.18qU0.65a），回答者数量（Ua）增加1%将导致回答数量（Na）增加0.65%。递减收益。对于特定因素，当指数小于1时，我们观察到递减收益-产出的减少0边际（增量）产出作为输入逐渐增加，而其他输入保持不变[18]。这种“递减收益法则”对StackExchange市场有许多有趣的影响，包括市场中新参与者的递减效益。例如，在学术界，如果回答者的数量为100，则新回答者的边际贡献为c(101^0.65-100^0.65)=0.129c，其中c是一个常数；相反，如果回答者的数量为110，则新回答者的边际贡献为c(111^0.65-110^0.65)=0.125c。因此，在学术界的回答生成中，当参与者数量（系统规模）为110时，与参与者数量为100时相比，包括一个参与者可能会带来较少的益处。规模收益。StackExchange的知识市场在规模效率方面有所不同，表现为其规模收益的增加-所有输入成比例增加导致的产出增加[18]。如果一个市场具有较高的规模收益，那么当市场从小规模运营转向大规模运营时，将获得更高的效率。例如，在学术界，对于回答生成，规模收益为0.18+0.65=0.83<1。随着回答生成的扩大，市场变得不那么高效，需要更多的问题和回答者才能以相同的数量增加回答的数量。07.2两个关键分布0接下来，我们讨论控制知识市场内容生成的两个关键分布，即参与者活动和主题POV（观点）。这两个分布引发了第7.1节中报告的三个现象。参与者活动。参与者活动的分布在内容参与方面隐含地推动了市场的回报，如相应的指数所示。例如，在一个假设的知识市场中，每个回答者的贡献是相等的，回答生成模型应该是Na =ANλ1qU1.0a。实际上，参与者活动的分布是一个由参与者数量（系统规模）控制的大小相关分布。随着系统规模的增加，大多数参与者贡献给分布的头部（少量活动），而很少有人加入尾部（许多活动）。0用户数量，U0幂律指数，α0android0用户数量，U0apple0用户数量，U0biology0图3：大小相关分布的可见性：强相关 - android；中等相关 -apple；弱相关 -biology。在大多数StackExchange市场中，幂律指数随系统规模减小，类似于android。在其他市场中，系统规模和幂律指数之间存在非零的相关性。0Track: Crowdsourcing and Human Computation for the Web WWW 2018, April 23-27, 2018, Lyon, France1 - 13010203014 - 2640 - 5253 - 6520000 80000.61.32.02.73.4Econ. Ratio, Na/q2004100010010300710我们通过三个步骤系统地揭示了参与者活动的大小相关分布。首先，我们对每个StackExchange市场每个月的参与者活动进行了幂律分布的实证拟合。我们遵循标准程序拟合幂律分布[2]。我们观察到幂律很好地描述了每月的活动分布。其次，我们绘制了幂律的指数与每个市场中所有观察到的月份的参与者数量之间的关系图，对于大多数StackExchange市场，随着系统规模的增加，幂律指数会减小。第三，我们应用线性回归揭示了幂律指数与系统规模之间的关系。我们观察到，总体上幂律指数与系统规模呈负相关。这种负相关在每个月至少有500名参与者的大型知识市场中非常明显。在图3中，我们提供了三个StackExchange市场（android、apple和biology）中回答生成的大小相关分布的实证证据。我们选择这些示例来涵盖大小相关分布的三种可能的可见性，即幂律指数与系统规模之间的相关性的强相关（| r2 | ≥ 0.5），中等相关（0.3 ≤ | r 2 | < 0.5）和弱相关（| r 2 | <0.3）。主题POV。主题POV的分布在内容依赖性方面隐含地推动了市场的回报，如相应的指数所示。主题POV是指对特定内容（例如问题）的不同观点数量，它对依赖内容（例如答案）的数量施加了概念上的限制。例如，一个开放式问题，如“你最喜欢的书是什么？”有很多可能的答案，而一个封闭式问题，如“3x+5 =2的解是什么？”只有一个正确答案。实际上，大多数问题既不完全开放式也不完全封闭式；然而，从回答者的角度来看，回答一个已经有答案的问题的效用会递减。这种递减效用因问题而异 -要求推荐的问题会吸引很多答案，而寻求事实信息的问题会吸引很少的答案。07.3 揭示稳定核心0我们发现每个StackExchange市场都有一个稳定的用户社区，该社区维持着动态平衡，即整体用户社区的增加或减少不会影响Cobb-Douglas模型。我们断言，这个稳定的用户社区产生了大量需要更多努力的高门槛内容，例如回答和评论，而其余的用户是不稳定的，并贡献了一小部分高门槛内容。我们通过总结具有不同任期水平（活跃月数）的用户的回答贡献来揭示稳定核心的存在。首先，对于每个StackExchange市场，我们将其用户分为五个任期水平进行等宽分组。然后，我们使用字母值图绘制每个类别用户的每月回答贡献分布。我们在图4中展示了android的字母值图。我们观察到每月回答贡献是任期水平的递增函数——贡献多个月的用户也贡献了大量回答。0回答数量0月份数0android0图4：android不同活跃月份用户的每月回答贡献分布。贡献多个月的用户也贡献了大量回答。08 规模上的失败0在本节中，我们讨论知识市场在规模上可能出现的失败原因及其原因。我们首先从实证角度研究规模不经济（第8.1节），然后分析规模对市场健康的影响（第8.2节），最后研究规模变化下的用户可交换性（第8.3节）。08.1 规模不经济0首先，我们研究规模不经济——问题回答比例随用户数量增加而下降。规模不经济的相反是规模经济，即比例随用户数量增加而增加。规模不经济的概念很重要，因为问题回答比例的下降意味着市场供应（回答）和需求（问题）之间的差距增加。事实上，如果比例低于1.0，差距将变得关键——保证会有一些问题没有答案。在图5中，我们展示了三个StackExchange市场（cstheory、puzzling和superuser）中的规模经济和规模不经济。我们选择这些例子来涵盖三种情况：强烈的规模不经济、强烈的规模经济和较弱的规模经济。在这三个市场中，superuser表现出强烈的规模不经济：如果0用户数量, U0superuser0Cobb-Douglas0用户数量, U0puzzling0Cobb-Douglas0用户数量, U0cstheory0Cobb-Douglas0图5：规模经济/规模不经济：问题回答比例随用户数量的增加而下降/增加。大多数StackExchange市场都表现出规模不经济。例如：强烈的规模不经济——superuser；较弱的规模经济——puzzling；强烈的规模经济——cstheory。0Track: Crowdsourcing

下载后可阅读完整内容，剩余1页未读，立即下载