没有合适的资源?快使用搜索试试~ 我知道了~
众包食品救援平台推荐系统
857众包食品救援平台推荐系统ryanshi@cmu.edu卡内基梅隆大学美国宾夕法尼亚州匹兹堡LeahLizarondo412Food Rescue美国宾夕法尼亚州匹兹堡菲方feif@cs.cmu.edu卡内基梅隆大学关闭PA,USA摘要粮食浪费和不安全的挑战在富裕国家和发展中国家都出现了目前的流行病只会使问题更加严重。作为打击粮食浪费和不安全的主要力量,粮食救援组织将粮食捐赠与为低资源社区服务的非营利组织相匹配。由于他们依靠外部志愿者来领取和运送食物,一些FR使用基于网络的移动应用程序来接触合适的志愿者。 在本文中,我们提出了第一个基于机器学习的模型,以提高志愿者在食物浪费和安全领域的参与度。 我们(1)开发了一个推荐系统,为每个给定的救援发送推送通知给最有可能的志愿者,(2)利用基于数学规划的方法来多样化我们的建议,(3)提出了一个在线算法来动态选择志愿者通知未来救援的知识。我们的推荐系统提高了命中率从44%达到以前的方法到73%。计划在不久的将来对我们的方法进行试点研究CCS概念• 信息系统→推荐系统;计算广告;·应用计算→经济学。关键词食品救援,食品浪费,食品安全,推荐系统,在线规划,人工智能为社会公益ACM参考格式:施哲元,李亚,方飞。2021年众包食品救援平台的推荐系统在网络会议2021(WWW '21)的会议记录,2021年4月19日至23日,斯洛文尼亚卢布尔雅那。ACM ,NewYork,NY,USA,9页。https://doi.org/10.1145/3442381.34497871介绍回想一下,你上次在杂货店看到几个满架子的面包,两天后就过期了,或者你上次在市中心看到一个无家可归的人要求吃饭。如果这两种情况对你来说都很熟悉,那就不是 粮食浪费和粮食不安全是世界许多地区共同面临的严重问题[11,19]。不幸的是,持续的COVID-19大流行本文在知识共享署名4.0国际(CC-BY 4.0)许可下发布。作者保留在其个人和公司网站上以适当的署名传播作品的权利WWW©2021 IW 3C 2(国际万维网大会委员会),在知识共享CC-BY 4.0许可下发布。ACM ISBN 978-1-4503-8312-7/21/04。https://doi.org/10.1145/3442381.3449787只会让事情变得更糟[22]。 即使在这一流行病达到高峰之后,在我们恢复正常的漫长道路上,基本粮食保障方面日益加剧的斗争也不会迅速平息。因此,现在比以往任何时候都更迫切需要采取行动,解决粮食安全和粮食浪费问题。在本文中,我们利用我们的人工智能专业知识与我们的合作者一起回答这个问题。粮食救援组织(FR)是打击粮食浪费和不安全的主要非营利力量 他们将捐赠者提供的新鲜、未过期的食物与服务于资源匮乏社区的组织相匹配,从而促进食物的再分配。1个FR依靠志愿者运送食物。为了与志愿者接触,FR使用手机上基于网络的应用程序发布即将到来的救援信息。有关食物救援行动的详细描述,请参阅第3节。事实证明,这种“众包”模式在与公众合作解决粮食浪费和不安全问题方面是成功的[41]。然而,依靠外部志愿者提供食物带来了固有的不确定性。 如果没有志愿者会要求救援呢? 这种不确定性在FR业务中普遍存在,并且具有严重的后果,例如捐助者和受援组织对该计划失去信心。由于FR联系志愿者的主要方式是通过推送通知,为了提高索赔率,人们当然希望向可能要求给定救援的志愿者发送推送目前,当发布救援信息时,移动应用程序会向捐赠者一定半径范围内的志愿者发送通知虽然接近捐赠者显然是一个积极的因素,但这远非完美的解决方案,因为它的命中率只有44%,这意味着它错过了“正确”的志愿者超过一半的时间。 另一方面,我们也希望避免一直向每个vol-unteer发送推送通知,因为这很容易将他们从平台上赶走,或者提示他们完全禁用通知[14]。一个定制的推送通知,有很好的理由,会更好地吸引用户。因此,将推送通知发送到可能要求救援的选定志愿者集合是至关重要的在本文中,我们提出了第一个基于机器学习的模型来选择正确的志愿者集合,以在食物浪费和安全领域进行通知。 通过把每个救援行程作为一个“用户”,每个志愿者作为一个“项目”,我们研究这个问题,从推荐系统的角度来看。推荐系统在过去的几年里受到了WWW社区的极大关注[12,21,26,45]。我们的任务是相关的文献,但也带来了一些新的挑战。 我们将这些挑战和我们应对这些挑战的方法陈述如下。1我们想强调,只有新鲜和未过期的食物才能通过FR捐赠。WWWZheyuan Ryan Shi,Leah Lizarondo,Fei Fang858首先,由于每个救援只发生一次,我们永远停留在推荐系统的“冷启动”阶段,从而使基于协作过滤的方法不适合。我们利用一组复杂的上下文特征,自适应欠采样技术和神经架构来开发基于内容的推荐系统。 我们表明,我们的模型优于一些基线,并提高了推荐正确志愿者的命中率为73%。这比目前的44%命中率提高了66%。其次,不能推荐不同的项目是一个严重的问题,在推荐系统的文献。在我们的申请中,这是特别令人关注的,因为“物品”是为这项事业贡献时间的人类志愿者。我们利用数学规划为基础的方法,通过施加多样性约束的输出的rec-commender系统。这确保了每个志愿者每天只收到有限数量的推送通知。第三,大多数关于推荐系统的文献假设离线环境具有静态数据集。然而,食物捐赠是按顺序到达的,因此联邦储备委员会必须在不知道未来救援的情况下做出相应的决定。根据我们在该领域的经验,我们确定了一个重要的抵达模式的食品救援之旅 依靠这一见解,我们开发了一个在线规划算法,依次选择志愿者通知,同时仍然满足多样性约束,我们早些时候施加。我们表明,我们的在线算法实现的命中率,只有10%比假设的离线模式,我们假设在一天开始的所有救援知识差。食品救援组织已经在美国和其他地区的大多数主要城市开展了工作仅在美国,就有50多个城市的FR为社区提供基本必需品,影响了100多万人。 412 Food Rescue(412FR)是匹兹堡的一家大型食品救援组织。 2自2015年成立以来,412 FR已为1,000多个非营利合作伙伴提供服务,并在大匹兹堡地区建立了一个由15,000多名志愿者组成的网络。我们在本文中描述的模型正在412 FR部署此外,我们认为,我们解决的问题并不局限于这个特定的应用:它可以适用于许多领域的众包类型的操作,依赖于志愿者来执行任务。2相关工作越来越多的文献使用人工智能或相关工具来研究食物救援行动。有些人制定了一个车辆路线问题,以匹配捐赠与收件人[20,31],而其他人则从公平分配和市场设计的角度解决问题[5,27,35]。 由于食品的需求和供应是在FR之外的,因此一些工作侧重于预测未来的食品供应[32,34]。 虽然所有这些作品提供了有用的见解FR操作,现有的文献在很大程度上错过了志愿者方面的过程。在为数不多的几件明确2https://412foodrescue.org/考虑食物救援的志愿者众包方面,Leeet al.开发了一个参与式民主框架,允许志愿者和其他利益相关者决定捐赠和接受者的匹配,这与我们的工作正交[24]。Shi等人开发了一个机器学习模型来预测是否会要求一次救援旅行,并开发了一个优化模型来寻找最佳干预方案[38]。我们的工作是对他们工作的补充,外勤人员可以同时使用这两项工作然而,我们在两个方面比他们进步首先,与他们的预测模型作为下游人工干预的决策辅助相比,我们的推荐系统直接改进了上游通知过程,这可以减少对昂贵的人工干预的需求。其次,与他们设置系统级通知参数的规定性模型相比,我们的推荐系统是特定于救援的,从而利用更多的信息来做出更好的决策。最后,Man-shadi和Rodilitz在类似的环境中设计了在线志愿者通知算法[28]。与他们的工作相比,我们采取了纯粹的以数据为中心的方法,对志愿者和救援模式做了很少的建模假设,唯一的目的是在这个系统的真实用例中找到最有可能的志愿者。关于推荐系统的文献非常多,我们将只讨论与我们的工作相关的两个主题冷启动是指新用户或新项目上没有以前的标签的情况[37]。 处理冷启动的一种主动方法是与用户交互以请求标签,这通常被认为是一个强盗问题[10,18,25,36,39,44]。这显然不适用于我们的设定,因为每一次救援都是一次性的,而且对于现实世界的试验来说,风险太高了因此,我们转向被动的方法,即利用我们所拥有的数据。基于内容的方法是这一挑战的自然候选者。协同过滤并不是为了完美地处理冷启动而设计的,尽管已经有方法通过辅助信息来增强它以解决这个问题[8,9,16]。 在本文中,我们提出了基于内容的模型,原因如下。首先,在我们的食品救援环境中,冷启动不仅仅是开始时短暂的不愉快时期,这可能意味着次要的关注。相反,我们永远停留在冷启动阶段,因为每个救援(用户)都是新的。因此,使用基于内容的模型完美地处理它是最重要的考虑。第二,我们根据食物救援行动的经验,确定了一套良好的互动功能。第三,目前没有基于协作过滤的系统阻止我们使用基于内容的方法。在推荐系统中利用神经架构的最新进展是我们建立我们的模型[21]。我们的问题也涉及到推荐系统的多样性,这涉及到个人的多样性和聚合的多样性。 个体多样性是指为每个用户推荐推荐列表中的不同项目[43,45]。 聚合多样性是指为不同用户推荐推荐不同列表之间的项目[1,7,15,30,33]。在我们的问题中,我们希望避免一直向一小部分志愿者(项目)发送推送通知因此,我们的问题涉及总体多样性。 在技术层面上,我们的建议多样化方法可以被认为是Adomavicius和Kwon [ 1 ]的整数规划方法的变体。···众包食品救援平台推荐系统WWW859×然而,我们的问题还有一个额外的微妙之处,这使得它更具挑战性,正如我们在下面讨论的那样。在食物救援中,每次救援都是按顺序到达的,因此我们需要在线做出推荐决策。 这给我们使建议多样化的努力带来了额外的挑战。这个问题类似于研究得很好的在线广告词匹配问题[3,17,29],并且可以适合更一般的在线线性规划框架[4]。然而,这些工作通常只保证渐近的结果或需要事先知道的救援数量在任何给定的一天,这使得他们在我们的设置不切实际。也有关于在线广告预算节奏的文献[2,23,42]。 我们的应用领域和中心问题与在线广告不同,但我们的在线推送通知预算规划可以被认为是一种新颖的方式。3粮食救援组织是粮食捐助者和受援组织之间的中介。捐赠者,通常是杂货店商店和餐馆,会打电话给FR时,他们有食品,他们想捐赠。在接到电话后,FR调度员将该捐赠与某个接收组织进行匹配,通常是服务于低资源社区的某个非营利组织。一旦匹配完成,调度员将在FR的移动应用程序上发布此匹配。此后,食物救援过程对志愿者来说变得可见。如图1所示,在手机上安装了FR移动应用程序的志愿者 如果他们选择在应用程序上申请,应用程序将为他们提供详细的信息,指导他们在哪里领取捐款以及在哪里交付。然后,志愿者走出去完成救援之旅。当然,上面描述的工作流是一个理想的场景。在现实中,偶尔,一些救援之旅停留在移动应用程序上很长一段时间无人认领。FR调度员希望尽可能地防止这种情况,因为每次救援都有一个截止日期,这取决于食物的性质以及捐赠者和接受者的工作时间。无人认领的救援会阻碍捐赠者和接受者将来参与该计划。FR有两种方法来解决这个问题。首先,它向可能的志愿者发送推送通知,宣传救援。第二,调度员可能会单独打电话给一些固定的志愿者寻求帮助。在以前的工作中,Shi et al. 重点放在后一种方法,以帮助调度员的决策[ 38 ]。我们专注于前者,直接找到最好的志愿者来发送推送通知。4数据为了开发一个推荐系统,我们需要正的和负的标记的例子。一个积极的例子意味着一个特定的志愿者(项目)要求一个特定的救援(用户);一个消极的例子意味着否则。在本节中,我们将详细介绍数据采集、标记和特征工程过程。4.1正标签我们从412FR获得了涵盖2018年3月至2020年3月期间的救援数据库数据库保存每个救援对于大多数救援,数据库记录其时间戳,从调度员起草,到在移动应用程序上发布,再到由志愿者认领和完成 对于这些救援,我们简单地将救援加上声称它的志愿者作为一个积极的数据点。然而,粮食救援行动并不总是那么整齐。有时,调度员提前知道一些志愿者会做这项工作,所以他们直接分配志愿者进行特定的救援,绕过应用程序通知阶段。 在这种情况下,我们也把这种直接赋值作为一个积极的例子。有时,一个志愿者可能会要求救援,然后放弃它,导致一些救援有多个志愿者在日志中。在这种情况下,我们根据最后一个志愿者创建标签4.2负面标签一个负面的例子意味着一个特定的志愿者没有要求一个特定的救援。 由于几乎所有的救援都只有一个声称救援的志愿者,显然我们的大多数数据点都会有负面的标签。然而,并不是所有这些负面数据都是正确的,因为如果其他人没有提前10分钟申请救援,志愿者可能会申请救援。因此,我们使用以下方法来构建一个选定的负数据集。首先,在我们的数据库所涵盖的时间段内,412 FoodRescue使用了移动应用程序推送通知方案,当救援首次可用时通知5英里内的志愿者,然后在15分钟后通知所有志愿者,如果救援没有被要求。因此,如果在15分钟内请求救援,我们只将5英里内并且没有选择退出推送通知的志愿者视为负面例子。我们还纳入了另一个数据源,以加强我们的负采样。 除了移动应用程序通知外,412FR的调度员还手动呼叫一些常规志愿者,以寻求特定救援的帮助。 这种情况通常发生在一些救援已经超过一个小时,但没有人声称它。我们从412 FR获得了通话记录,从中我们确定了他们在每次救援时间范围内联系的志愿者如果这些志愿者最后没有要求救援,我们就把他们当作反面教材。 与来自推送通知的负面示例相比,我们对这组负面示例更有信心,因为拒绝电话呼叫比忽略推送通知更强。4.3特征工程基于我们与412FR的广泛合作,我们仔细确定了一组与食品救援行动相关的有用功能首先,食物救援调度员的经验表明,如果志愿者在捐赠者或接受者附近完成了救援,他们更有可能在附近再次进行救援。如图2所示,我们将大匹兹堡地区划分为16个单元。我们将一个中心矩形区域均匀地划分为一个3 × 5的网格,并将它们标记为网格单元0到14。然后,我们标记矩形区域单元15之外的整个地图。 其基本原理是,在远郊有较少的捐助者,受援国和志愿者,而且志愿者谁在郊区更愿意做长途,即。比市中心的志愿者更有帮助对于每一次救援和每一个志愿者,我们计算WWWZheyuan Ryan Shi,Leah Lizarondo,Fei Fang8601213140 1 21512131401215×(1) 接收推送通知(2) 在移动应用程序(3) 从捐赠者处(4) 发送给收件人(5)成功!图1:从志愿者的角度看食物救援行动的工作流程91011678345(a)捐助组织的分布。颜色越深意味着捐赠越频繁。我们用随机扰动绘制供体位置。91011678345(b) 受援组织的密度。较深的颜色意味着网格中有更多的组织。如果在延长的时间段内进行程序并保持活跃,则它们也可能是有规律的和可靠的,这在图3b中的300-600天左右的上升趋势和平台得到证实。因此,我们在预测模型中包含了这一特征天气信息也是预测的一个重要因素一般来说,下雨和下雪的日子志愿者的活跃度会较低。然而,恶劣天气的影响将不成比例地落在没有汽车或住在郊区的志愿者我们使用美国国家海洋和大气管理局提供的气候数据在线(CDO)服务来获取天气信息。3CDO数据集包含在天数和气象站的离散化级别上的天气信息匹兹堡地区有多个气象站,对于每次救援,我们都会选择救援日期的数据以及距离捐助组织最近的气象站。如图3c所示,在潮湿的日子里,相对更多的志愿者声称救援居住在匹兹堡市中心(单元4和7)。而在图2:我们将匹兹堡地区划分为16个网格单元,其中单元0-志愿者在救援捐赠者的细胞中、在救援接受者的细胞中以及在所有细胞中完成的救援次数这些计数仅截至给定救援的日期,以便我们可以防止数据泄露。我们还试图在每个单元格中包括志愿者然而,它们没有贡献任何预测能力,因此我们将它们排除在最终模型之外。与此密切相关的是志愿者和捐赠者之间的距离志愿者不太可能开车30英里去领取捐赠品,如图3a所示。 我们使用基于地理坐标的直线距离来测量距离。虽然实际行进距离可能是一个更好的指标,但我们观察到直线距离已经达到了我们的目的。除了地理信息之外,志愿者在平台上注册和救援之间的时间长度也是一个重要因素,正如我们在412FR的合作者所建议的那样。我们在图3b中绘制了这个变量的直方图。立即在干燥的日子里,更多住在匹兹堡远郊(15号牢房)的志愿者活跃起来。事实上,我们还发现志愿者和捐赠者在干旱天气(5.94英里)和雨天(5.22英里)之间存在显著差异,t检验p值为3 10−8。我们还探索了一些其他功能,但没有将它们纳入我们的最终模型。这些特征包括救援的一天中的时间和一周中的日期、志愿者的可用性、志愿者是否将头像上传到他们的个人资料中、志愿者是否与捐赠者或接受者位于同一网格中,等等。虽然这些都是直观的因素,但我们没有发现它们可以提高我们模型的预测能力,因此将它们排除在外。5推荐系统我们建立了一个基于神经网络的推荐系统。 我们首先详细介绍了我们的网络架构,然后讨论我们的方法来解决粮食救援领域的独特挑战。我们在表1中显示了神经网络架构。神经网络的输入是救援志愿者对的特征向量。特征向量穿过四个密集层。每一层后面都有一个ReLU激活函数,除了最后一层,我们输出一个数字,然后转换登记后,志愿者渴望获得救援,感受食物救援的经历。如果一个志愿者坚持3https://www.ncdc.noaa.gov/cdo-web/众包食品救援平台推荐系统WWW861X1031030.251021020.200.15101100020 4060101025050075010000.100.050.000 1 2 3 4 5 6 7 8 9 101112131415献血者和志愿者之间的距离(英里)(a) 救援直方图,基于捐赠者和声称救援的志愿者之间的距离从登记到抢救的天数(b) 救援直方图,基于救援和声称救援的志愿者登记之间图3:数据分析结果。志愿者网格细胞(c) 根据声称救援的志愿者的位置,在潮湿和干燥天气下的救援直方图图层操作隐藏单位1密集(ReLU)3842密集(ReLU)20483密集(ReLU)5124密集型(物流)16表1:神经网络架构通过逻辑函数将其转换为0到1之间的数字该输出表示该志愿者将要求该救援行程的可能性我们使用交叉熵损失来训练神经网络。为了输出k个志愿者的列表,我们在预测时间向他们发送特定救援的推送通知,我们通过网络传递固定救援中所有志愿者的救援-志愿者对的特征向量,并对输出进行排名,以获取其中的前k个。5.1负采样如前所述我们的数据集中存在极高的标签不平衡。 从2018年3月到2020年3月,共有6757次救援可用于培训。每次救援通常只有一名志愿者,匹兹堡地区有9212名注册的活跃志愿者。 这意味着,从理论上讲,负面和正面例子之间的比例超过9000:1。使用第4.2节介绍的方法,我们可以获得一组选定在应用中,这可能导致超级明星项目上的“富人更富”现象,以及不太受欢迎的项目上的收入机会的错失。所有这些都是有效的。然而,正如我们在本文中多次强调的那样,在我们的rec-ommender系统的另一边的“项目”是人类。上述缺乏多样性的后果在我们的情况下只会更成问题。 如果一个受欢迎的志愿者一整天都收到每一次救援的推送通知,他们可能会感到恼火,并将通知静音。 另一方面,对于那些已经不太活跃的志愿者来说,如果我们的系统从未向他们发送推送通知,他们可能会忘记这个平台,不太可能再回来。因此,妥善处理多样性问题至关重要我们区分两种多样性概念:个体多样性和总体多样性。前者意味着每个用户(救援)都会被推荐一组不同的项目(志愿者)。后者意味着跨不同用户(救援)的推荐项目(志愿者)组合覆盖了项目空间的大部分。 我们以人为本的方法决定了我们在这里专注于聚合多样性。事实上,我们关注的是一个稍微不同的指标:每个志愿者每天被推荐参加救援我们希望对这个指标设置上限,这与每个志愿者的用户体验直接相关为此,我们可以为给定的一天的食品救援行动制定以下数学程序另一组反例Dc源自调度程序调用。集合Dc略小于正例Dp,而|:|D p|700:1。|≈700:1. 在训练神经网络工作时,() max . .派伊杰I.∈Rj∈Vxij用Dp和Dc中的所有例子。然而,我们在训练的每一集从Dn中随机抽取一个样本子集。通过这样做,我们确保来自Dn的否定示例不会主导训练集,同时来自D c的“更确定”的否定示例比D n得到更多的这S. t.j∈Vi∈Rxij≤k,ni∈Rxij≤b,nj∈V整个过程导致每个批次中阴性和阳性样品之间的总比率约为3:15.2多样性和在线规划推荐系统通常会遇到多样性问题,其中商业xij∈ {0, 1},i∈R,j∈V让V表示志愿者的集合 在特定的一天,我们有一组救援R。如果我们决定向志愿者j发送关于救援i的推送通知,则二元决策变量xij等于1。第一个约束表明,对于每次救援,我们将通知前k名志愿者,如第5节开头所述。潮湿的日子干燥的日子计数计数抢救比例.WWWZheyuan Ryan Shi,Leah Lizarondo,Fei Fang862∈∈X∈./算法1:仅针对选项推送进行Pl定位不适用输入:一个经过训练的神经网络预测器当新的救援到来时,2冲洗Xi对于dayToSample = 1、2、. . . H do4对从当前救援i的时间到当天结束发生的dayToSample上的救援集合R进行5计算所有iR,所有jV的预测索赔概率pij和pi′ j。6解决以下优化问题:前,等等。基本的想法是,同样的工作日可能有类似的救援模式。 这是因为412FR的大多数捐赠来自杂货店或大型公司/大学。杂货店通常每周进行库存盘点。公司和大学经常每周举办活动,提供餐饮。 对于每个采样日,我们只取当前救援时间到当天结束的轨迹。然后,对于每个轨迹以及当前救援,我们获得神经网络 除了每个志愿者现在都有自己的推送通知剩余预算外,Push i与Push类似。请注意,现在所有的一切都在ESTA观察和已知的,而(i) max ..pijxij+J.∈VI.R′pi′jxi′j在决策时,未来的救援是未知我们只保留最优解决方案中与当前救援有关的部分,而抛弃其余部分。稍后,在算法1的第8行,对于每个志愿者,我们将其在最优解中的值相加S. t.j∈Vj∈Vxi′j≤k,ni′∈Rxij≤k.在所有采样轨迹中。 我们选择这些解决方案投票选出的前k名志愿者,他们将成为我们为当前救援发送推送通知的人。我们注意到,优化问题1和算法1是非常灵活,可以考虑许多其他因素。xij+i′∈Rxi′j≤bj,<$j∈V例如,我们可以使用个人预算bj来表示志愿者的推送通知,并添加额外的约束xij∈ {0, 1},i∈R,j∈V7在Xi中保留仅用于当前救援的最优解x i j。8对采样历史求和,找到前k名志愿者。9向他们 发送推送通知。更新每个志愿者j的剩余预算bj。喜好 我们还可以给目标函数增加权重,以强调特定救援的重要性。6实验6.1推荐系统我们使用的训练集包含2018年3月至2019年10月的救援,占整个数据集的80%。 我们使用2019年11月至2020年3月的剩余1373次救援作为测试集。我们在Intel i7- 7700 K 4.20GHz上进行了所有实验第二个约束是我们的多样性约束,它确保每个志愿者每天最多收到b个推送通知目标中的pij是我们训练的神经网络的输出,表示志愿者j将请求救援i的预测可能性。虽然这个优化问题是一个有效的方法来提高通用推荐系统的多样性,它并没有解决我们的设置的问题 原因是,捐赠,因此食品救援之旅,在一天中顺序到达我们的系统,调度员也必须实时采取行动。等到一天结束,运行上面的优化问题,然后发送推送通知是不可接受的因此,我们需要一个在线算法。一个直观的方法是求助于在线线性规划的文献[1]。事实上,我们可以想象求解π,其中在每个时间步,一个新的救援被揭示在x矩阵和p矩阵中的一个新列。但是,我们不知道有多少救援将在一天开始。 这是一个主要的障碍,在应用已建立的算法与理论保证。相反,日常救援模式在本质上几乎没有对抗性,因此我们提出了一个简单的启发式算法,如算法1所示。在算法1中,当食物救援到达系统中时,我们对轨迹的历史救援数据进行通常情况下,我们会在一周前的同一个工作日,CPU 64GB RAM首先,我们只考虑算法的预测部分我们将我们的神经网络推荐系统与几种常用的竞争基线进行了比较,包括随机森林(RF),梯度提升决策树(GBDT)和堆叠模型(SM)。为了确定基线模型和神经网络模型的超参数,我们分离出由训练集的最后18个组成的验证集,然后根据验证集上的性能运行网格搜索。对于基线上的实验,我们对Dc和Dp使用与5.1节中描述的相同的负采样方法。至于来自应用通知Dn的负示例,由于基线不是基于梯度下降的方法,因此我们在两个方案中对它们进行采样,使得正示例和负示例之间的比率分别约为1:1和1:20。我们考虑后者,因为这大约是神经网络方法在整个训练过程中看到的负面示例的数量,以确保公平的比较。我们在测试集上显示了所有这些算法的结果,平均-老化超过 5 次运行,见 表 2 。 我们考虑 表2中k处的命中率(HR@k)和k处的归一化贴现累积增益(NDCG@k)。然而,我们注意到,我们感兴趣的主要指标是命中率,因为在发送推送通知时,我们不关心每个志愿者在众包食品救援平台推荐系统WWW863103表2:基于神经网络的记录器系统的性能和几个基线。所有实验重复五次,平均值和标准偏差见表。名单也正因为如此,HR@k是我们在所有预测模型的超参数网格搜索期间的主要指标。 我们选择k的值为964,因为这是在当前通知方案下每个救援发送的推送通知的平均数量。 目前基于距离的通知方案的命中率为0.4392。 所有基线都显示出比当前方法更好的性能,其中随机森林和GBDT优于堆叠模型。然而,基于神经网络的预测模型优于所有基线。神经网络模型的命中率比当前基于距离的方法提高了66%这意味着我们每年将能够在大约900次救援中接触到潜在的志愿者。每一次救援都有一个捐助者和一个为数十或数百人提供服务的受援组织。一个顺利的食物救援经验不仅可以为这些人提供基本的食物必需品,还可以鼓励这些组织以可持续的方式保持参与。6.2多样性和在线规划如5.2节所述,推荐系统通常会遇到多样性问题。这个问题在我们的模型中也存在在图4中,我们绘制了每个志愿者在测试集救援中收到的推送通知数量的直方图基于神经网络的推荐系统,如图4中黄色所示,呈现出令人担忧的双峰分布:大多数志愿者要么几乎没有收到推送通知,要么几乎每次救援都会收到推送通知 我们注意到,虽然最右边的箱中的志愿者人数(9312人中的446人)比最左边的箱中的志愿者人数(9312人中的7458人)少得多,但前者更令人担忧。 这是因为他们通常是最“积极”的志愿者,对粮食救援计划贡献最大。事实上,这446名志愿者中包括前50名最频繁的志愿者中的39名和前100名中的51名。如果他们因为太多的通知而离开平台,这很可能会发生,如果拟议的推荐系统得到部署,412FR的损失将不成比例地高。 另一方面,默认的基于距离的通知方案不会受到这个问题的影响,如图4中红色部分所示。 虽然大多数志愿者仍然很少收到推送通知,但每个志愿者的通知频率大约是每两次救援一次。1020 250 500 750 1000 1250收到1373次救援的图4:在测试集中的所有1373次救援中,每个志愿者收到的推送通知数量的直方图。在线计划算法的预算为每天6个通知。图4是对现实世界中机器学习算法过早部署的严厉警告。 某个模型在某些重要指标(这里是命中率)上比当前实践高出66%,并不意味着它不会引起其他问题。我们使用算法1来提高志愿者推荐的多样性。作为初步和直接的比较,我们使用七天前的救援作为采样历史,以预算b =每天6个推送通知运行我们的在线规划算法1。 我们在图4中用黄色绘制了它的通知直方图。 很容易看出,在线规划算法实现的推送通知分发比单独的推荐系统更类似于默认方案。它完全避免了向任何特定的志愿者发送关于每一次救援的推送通知。实际上,算法1对推荐多样性的影响取决于预算参数b。在图5中,我们绘制了不同预算值选择的通知分布,并将其与推荐系统和默认通知方案的通知分布进行随着预算的增加,来自算法1的推送通知的分布接近推荐系统的分布。 我们注意到,每个直方图的最右峰值的位置不应被解释为推送通知发送总数的指示器。在所有这些实验中,我们将每次救援的通知数量限制在k=964。除了预算非常少的情况外,算法总是为每次救援通知964名志愿者。这里的多样性目标是使直方图在图的右侧占据尽可能少的空间。尽管我们证明了推荐多样性的改善,但我们也希望确保我们算法的推荐准确性不会下降太多。预算参数b捕获了多样性和推荐系统在线规划默认志愿者人数模型HR@k(SD)NDCG@k(SD)NN0.7269(0.0310)0.1898(0.0147)RF(1:1)0.5989(0.0395)0.1319(0.0303)RF(1:20)0.6035(0.0511)0.127(0.0053)GBDT(1:1)0.6235(0.0549)0.1613(0.0098)GBDT(1:20)0.5394(0.0152)0.1023(0.0086)WWWZheyuan Ryan Shi,Leah Lizarondo,Fei Fang864默认推荐系统在线计划-最多4/天在线计划-最多7/天在线计划-最多10/天在线计划-最多13/天H R离线−1041031021011000 250 500 750 1000 1250收到1373次救援的图5:每个志愿者在测试集中的所有1373次救援中收到的推送通知数量的直方图,在不同的预算值之间进行比较。0.80.250.70.200.6差异作为“在线规划价格”,计算如下1H R在线。事实上,图6显示了在线计划的价格随着预算的增长而下降,并且当算法具有潜在的部署兴趣时(性能优于当前实践),价格始终小于0.1这验证了我们在5.2节中的主张,即前一周同一工作日的救援是当前救援的合理良好指标。7结论和未来方向食品救援行动的一个关键目标是能够及时到达“正确”的志愿者手中。与412食品救援组织合作,开发了一个机器学习模型,为每个给定的救援推荐最有可能发送推送通知的志愿者。我们的机器学习模型将当前通知方案的命中率提高了66%。食物救援行动有两个主要挑战:推荐的多样性对于确保志愿者体验至关重要,推荐必须以在线方式进行我们提出了一种新的算法来实时动态推荐志愿者进行救援,同时使推荐多样化,并仍能保持命中率远高于当前的做法。命中率低的问题是一个需要解决的现实问题。 对于数据驱动的方法来说,这也是一个自然的问题,我们确实有相关的数据。 存在解决此问题的现有方法(基于距离的通知),因此我们的技术干预不会引入新的举措。相反地,0.50.40.30.22.5 5.0 10.0 12.515.0每日推送通知预算0.150.100.05我们扩大现有的倡议。许多以前的努力已经表明,这种放大方法更有可能实现部署和可持续影响[40]。事实上,我们的技术干预并没有取代、减少或试图支配FR的任何人类员工的工作。在食品救援行动中,有两个近期的方向是有用的。首先,我们的算法1具有经典的预测然后优化框架,其中学习目标和优化目标并不完全一致。这将是有趣的考虑最近的文献数据驱动的光学,图6:在线规划算法的命中率。价格在线规划,计算为1−H R在线,显示在mization[6,13],以进一步改善图6所示的结果。当然,我们的问题的在线性质带来了额外的-右轴H R离线有趣的挑战,在文献中从未被提及第二,推荐必然受到反面因素的限制在第4.2节中,我们提出了几种方法来选择精度如图6所示,黄色曲线表示算法1的命中率 当预算超过每天四个通知(这是相对微不足道的量)时,算法1优于现有的通知方案。 当预算上升到每天10条通知或更多时,命中率非常接近裸骨推荐系统。为了进一步评估算法1中的在线规划的质量,我们还解决了问题的离线版本,其中我们针对每一天单独求解数学程序,作为关于当天救援的全部信息。我们在图6中用蓝色显示了这个离线版本的推荐决策的命中率。 由于拥有完整的信息总是更好,因此蓝色曲线总是位于代表在线计划的黄色曲线之上。不过,差别并不大。我们称之为最可信的反面例子 除了明确标记的例子之外,识别可信的正面例子将是有趣的,这些例子在数据集中相当稀少。计划在不久的将来对本文所述的模型和算法进行试点研究致谢我们衷心感谢412 Food Rescue的合作者贡献他们的时间、专业知识、经验和数据集。他们是这项工作背后的无名英雄。 我们感谢412食品救援组织和世界各地的其他食品救援组织在这个关键时刻支持我们的社区。 这项工作得到了NSF资助IIS-1850477的部分支持。在线规划脱机planning推荐系统默认在线规划志愿者人数命中率在线规划众包食品救援平台推荐系统WWW865引用[1] Gediminas Adomavicius和YoungOk Kwon。2014.最大化聚合推荐多样性的基于优化的方法。 INFORMS Journalon Computing 26,2(2014),351-369.[2] Deepak Agarwal,Souvik Ghosh,Kai Wei,and Siyu You.2014年。商 务 社交网站LinkedIn针对性在线广告的预算调整。20th ACM SIGKDD InternationalConference on Knowledge Discovery and Data Mining(第)1613[3] Gagan Aggarwal,Ashish Goel,and Rajeev Motwani.2006年。为搜索关键字定价的真实拍卖 第七届ACM电子商务会议论文集。一比七[4] Shipra Agrawal,Zizzhuo Wang,and Yinyu Ye. 2014.在线线性规划的动态近优算法 运筹学62,4(2014),876- 890。[5] 马丁·亚历山德罗夫,哈里斯·阿齐兹,塞尔日·加斯佩斯和托比·沃尔什。2015年。在线公平分工:分析食品银行问题。 第24届国际人工智能会议论文集。2540-2546[6] Dimitris Bertsimas 和 Nathan Kallus 2020. 从 预 测 性 分 析 到 规 范 性 分 析Management Science66,3(2020),1025[7] Erik Brynjolfsson,Yu Hu和Duncan Simester。2011.再见帕累托原则,你好长尾 : 搜 索 成 本 对 产品销售集 中 度 的影响。 Management Science57 , 8(2011),1373[8] T. Chen , Linpeng Tang , Q.Liu , Diyi Yang , Saining Xie , XuezhiCao,C.Wu,E.Yao,Zhengyang Liu,Z.江角,澳-地Chen,WeihaoKong,and Yingrui Yu.2012年。结合因子分解模型和加法森林的协同追随者推荐。[9] 陈天启,张伟南,陆秋霞,陈凯龙,赵铮,俞勇。2012. SVDFeature:一个基于特 征 的 协 同 过 滤 工 具 包 The Journalof Machine Learning Research 13 , 1(2012),3619-3622.[10] Konstantina Christakopoulou,Filip Radlinski,and Katja Hofmann.2016年。会话式推荐系统。 第22届ACM SIGKDD知识发现和数据挖掘国际会议论
下载后可阅读完整内容,剩余1页未读,立即下载
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功