美国COVID-19政策对疫情的因果影响：神经网络评估

173 浏览量更新于2023-11-29 收藏 1.25MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

2678评估COVID-19相关政策对疫情动态的因果影响：美国的案例研究马晶1，董玉顺1，黄正1，Daniel Mietchen1， 2，李俊东11University of Virginia，Charlottesville，VAUSA 229042德国苏尔茨巴赫弗劳恩霍夫生物医学工程研究所{jm3mr， ju6eb， zh4zn， jundong}@virginia.edu， daniel. ibmt.fraunhofer.de摘要分析不同政策对减少COVID-19传播的因果影响至关重要。这里的主要挑战是存在未观察到的混杂因素（例如，居民的警惕性），影响政策的存在和COVID-19的传播。此外，由于混杂因素可能是随时间变化的，因此更难以捕获它们。幸运的是，来自各种在线应用程序的网络数据的日益普及提供了随时间变化的观测数据的重要资源，并增加了从其中捕获混杂因素的机会，例如，随着时间的推移，居民的警惕性可以从谷歌搜索COVID-19在不同时间段的受欢迎程度中反映出来。在本文中，我们研究了评估不同COVID-19相关政策对任何给定时间段不同县疫情动态的因果影响的问题。为此，我们整合了涵盖美国不同地区的县随时间的变化，然后开发一个基于神经网络的因果效应估计框架，该框架从观察数据中学习时变（未观察到的）混杂因素的表示。实验结果表明，我们提出的框架在量化政策的因果影响在不同的粒度，从一类政策与特定的政策类型的特定目标的有效性。与基线方法相比，我们对政策的评估与现有的COVID-19流行病学研究更加一致。此外，我们的评估也为未来的政策制定提供了见解。CCS概念• 应用计算→法律、社会和行为科学;• 计算数学→因果网络。关键词COVID-19，因果推断，个体治疗效果，网络，观察数据ACM参考格式：马晶1人，董玉顺1人，黄正1人，米琴1人，2人，李俊东1人。2022年评估COVID-19相关政策的因果影响允许免费制作本作品的全部或部分的数字或硬拷贝，以供个人或课堂使用，前提是制作或分发副本的目的不是为了盈利或商业利益，并且副本的第一页上有本声明和完整的引用。版权的组成部分，这项工作所拥有的其他人比ACM必须尊重。允许使用学分进行摘要以其他方式复制、重新发布、在服务器上发布或重新分发到列表，需要事先获得特定许可和/或付费。请求权限请发邮件至permissions@acm.org。WWW©2022计算机协会ACM ISBN 978-1-4503-9096-5/22/04。. . 十五块https://doi.org/10.1145/3485447.3512139爆发动力学：美国的案例研究在ACM Web Conference 2022（WWW '22）的会议记录中，2022年4月25日至29日，虚拟活动，法国里昂。ACM，NewYork，NY，USA，9页。https://doi.org/10.1145/3485447.35121391介绍2019冠状病毒病（COVID-19）严重影响了人类生活的各个方面[9，32，33，36，42，45，47]。为了控制其传播，决策者和公共当局发布了各种政策[3，12，18，19，22，30，53]。相应地，一个自然的问题是：在特定背景下，哪种政策更有效地减缓COVID-19的传播？相关性分析[25，40]等各种研究从统计学角度解决了这个问题该等研究只能捕捉政策与COVID-19传播之间的统计然而，从因果关系的角度回答这个问题是至关重要的，因为它可以为政策制定者提供指导，以应对其他流行病，甚至是当前流行病的进一步浪潮[10，14，39]。然而，因果效应估计的黄金标准，即，由于伦理和实际问题，随机对照试验[7]不适用于大流行情况[2]。因此，不同政策对COVID- 19爆发动态的因果影响（例如，确诊病例数）预计将直接用观察数据进行评估在本文中，我们利用观测数据评估了不同COVID-19政策对疫情动态的因果影响具体来说，我们研究这个问题：给定一个特定的时间段，COVID-19政策（原因/治疗）对每个县（实例）的疫情动态（结果）的因果影响是什么？例如，2020年3月，弗吉尼亚州Albemarle县的确诊病例数量会因州政府制定社交距离政策而发生怎样的变化？根据观察性数据进行因果效应估计的一个关键挑战是存在未观察到的混杂因素（混杂因素是影响治疗和结局的因素），这可能会给估计带来混杂偏倚[49]。例如，在一个居民对COVID-19高度警惕的县，政府可能会在大流行的早期阶段发布政策以强制实施社交距离，但该县的居民也往往对COVID-19更加警惕，因此即使没有上述政策，感染的可能性也较在这里，居民的警惕性是一个混淆因素，如果处理不当，我们可能会错误地将这些政策的存在与疫情动态之间的统计相关性视为因果关系。可以通过调整所有混杂因素来消除混杂偏倚（即，控制混杂因素）[49]。然而，大多数现有的COVID-19因果评估工作[21，44]2679WWW来自观测数据的相关策略基于不混淆假设[49]，即，可以观察到所有混杂因素。类似地，广泛使用的差异中差异（DID）方法[1]基于平行趋势假设[15]，即，在一段时间内，没有（未观察到的）影响治疗和结果增长趋势的然而，在现实世界中，由于存在未观察到的混杂因素，这些假设很难得到满足。许多混杂因素难以量化，例如，居民此外，由于COVID-19大流行已持续超过一年，一个新的挑战是未观察到的混杂因素也可能是随时间变化的，例如，居民然而，据我们所知，目前大部分有关COVID-19相关政策的研究均缺乏应对上述挑战的能力[13]。为了解决这些问题，我们首先采用了一种较弱形式的未混淆假设[1]，这使我们能够从代理变量中捕获未观察到的混淆因素，即，与未观察到的混杂因素有依赖关系的变量例如，某些混杂因素，如某个县的居民警惕性，可以从谷歌上关于COVID-19相关关键词的网络搜索的受欢迎程度推断出来。直觉上，人们越警惕，就会越频繁地搜索COVID-19术语。此外，居民一个潜在的原因是，邻近的县往往有更多的互动和类似的文化，因此他们的居民将有类似的警惕性。过往资料（例如所采纳的政策及较早时期COVID-19的传播）亦可能影响现时的混杂因素（例如居民的警觉性）。使用这些代理变量，可以捕获混杂因素，因此可以进行无偏因果效应估计。考虑到这一点，我们整合了来自多个不同数据源的数据，包括美国391个县。我们认为我们选择的县代表，因为他们涵盖不同的国家与不同的政治意识形态。我们的数据包括COVID-19相关政策作为治疗，确诊病例或死亡病例数量作为结果。此外，它还包括每个县的多个协变量和不同县之间的关系信息，这些信息可以作为捕获未观察到的混杂因素的代理变量。为了解决我们所研究的问题，我们利用上述观测数据，并提出了一个基于神经网络的框架-C OV I D-19 de confounde r（CIDER），学习（未观察到的）混杂因素的表示。通过学习的表示，我们估计了不同政策对COVID-19爆发动态的因果影响。在我们提出的框架中，递归神经网络（RNN）[37]用于捕获时间信息，而图卷积网络（GCN）[28]用于处理不同国家之间的关系信息。在每个时间段，我们预测疫情动态以及这些政策是否在每个县生效通过这种方式，我们可以有效地未选中的县选定的县图1：我们语料库中所选县的地理位置我们的贡献可以概括为：1）我们研究了估计COVID-19政策对给定县和特定时间段疫情动态的因果影响的重要问题。2）我们整合了多个COVID-19相关来源的数据然后，我们开发了一个基于神经网络的框架，基于关系和随时间变化的观测数据来控制未观察到的混杂因素。3）我们使用已开发的框架评估不同政策对COVID-19疫情动态的因果影响。评估包括不同粒度的策略，从具有特定目标的一类策略到特定策略类型。4）我们进行了广泛的实验，发现我们的框架优于几种替代方案，并为当前或未来的流行病提供了重要的见解2数据和分析在本节中，我们描述如何准备数据以评估COVID-19相关政策对疫情动态的因果影响一些初步的数据分析也显示了捕获（未观察到的）混杂因素的潜在能力。2.1观测资料一般来说，在因果推理研究中，两种基本类型的信息是必不可少的，即，治疗和结果。具体而言，在治疗方面，我们收集美国不同县于二零二零年全年颁布的COVID-19相关政策;在结果方面，我们使用不同县于二零二零年全年的确诊病例和死亡病例数。为了控制未观察到的混杂因素的影响，我们还收集了不同国家的协变量及其关系的数据。特别是，在我们的研究中使用了两种类型的网络。总的来说，在过滤了没有足够数据的县之后，我们的数据语料库包括美国的391个县。这些选定的县在我们的语料库中的位置如图所示1.一、然后，我们介绍如何收集和预处理数据如下。治疗-COVID-19相关政策我们从美国卫生与公众服务部1收集2020年在美国生效的COVID-19相关政策&。总共有60种策略类型，以及描述和开始/结束日期。所收集的政策包括州一级和县级政策。对于州一级的政策，我们假设该政策适用于该州的所有县;对于县一级的政策，它们被认为只适用于相应的县。为了更好地分析这些政策的效果，我们执行了利用观测数据并学习时间的表示COVID-19政策因果评估的不同混杂因素1https://catalog.data.gov/dataset/covid-19-state-and-county-policy-orders2680（）下一页/（）评估COVID-19相关政策的因果影响on Outbreak Dynamics：A Case Study in the USWWW预处理包括：（1）策略过滤。我们删除了在我们的语料库中不到10%的县中采用的政策类型，因为我们没有足够的观测数据。（2）政策分类。根据每项政策的目标和一些关键要素，我们将其分为三类：通过社交距离（以下简称社交距离）减少接触，通过重新开放（重新开放）减少对经济的损害，以及通过口罩要求（口罩要求）减少空气传播。对于每个类别，图。2显示了最多县采用的前10大政策类型，以及2020年全年采用的县比例结果-确诊和死亡病例数2020年1月至12月，这391个县的每日确诊和死亡病例数从约翰霍普金斯冠状病毒资源中心2收集。在我们的实验中，我们将这些数字视为每个县的结果。协变量-谷歌上关键词的受欢迎程度。难以捕获因果影响策略和爆发动态的未观察混杂因素。因此，我们使用一些代理变量，如县的协变量来推断这些混杂因素。更具体地说，我们认为COVID-19相关关键词的网络搜索（例如，冠状病毒、口罩、检疫等）作为协变量。我们从Google Trends3收集此类网络搜索数据。在此过程中，我们首先选择一组COVID-19相关关键词，然后根据GoogleTrend中每个国家的总搜索量的相应比例获得其受欢迎程度得分。较高的受欢迎程度分数意味着该县有较大比例的人对COVID-19有高度警惕总共选取了19个不同的关键词，我们获得了2020年2月至12月每天每个县的19维协变量向量。网络-距离网络和移动流网络。以前的工作[16，17]表明，实例之间的网络结构可以反映一些未观察到的混杂因素。因此，在这项工作中，两个网络，包括地理距离网络和移动流网络之间的选择391个县收集作为另一种代理混淆。1）地理距离网。县与县之间的地理距离网络可用于捕获混杂因素。直觉上，地理位置较近的城市更有可能具有类似的混杂因素[16]，例如居民我们基于来自County Distance Database 4的地理距离在391个县之间构建加权网络，其中节点表示县，并且根据县对之间的相应距离计算边权重。具体地，我们选择距离小于阈值τ = 100公里的县对，并且将距离为di，j的第i个县和第j个县之间的边的权重设置为1 di，j。2）流动网络。也可以采用县之间的流动网络来捕获混杂因素，因为流动性大的县更有可能具有类似的混杂因素[16，17]（例如居民的警惕性），因为他们有更多的通信。我们基于COVID 19 USFlows [26]在391个县之间构建了一个带有加权边的时间移动流网络，该网络跟踪匿名GPS2https://coronavirus.jhu.edu/map.html3https://trends.google.com/trends/?geo=US4 https：//www.nber.org/research/data/county-distance-database基于移动应用程序的ping在这个时间网络中，移动性流的每日总量以不同的尺度聚合人口普查区、县和州）w.r.t.从2020年2月到12月的时间轴每个节点表示一个县，并且每个边的权重从相应的一对县之间的移动流量计算。具体来说，我们将权重设置为log flow（i，j），用于maxi，j logf low（i，j）第i个和第j个县，具有移动性流（i，j）。2.2初步数据分析为了探索协变量和网络是否有潜力捕获（未观察到的）混杂因素，我们进行了初步数据分析，以探索它们与COVID-19爆发动态的依赖关系（即，确诊/死亡病例数由于篇幅所限，我们仅以弗吉尼亚州（VA）和马萨诸塞州（MA）的10个县的累计确诊病例数为例进行分析。在其他县也可以发现类似的情况，以及死亡病例的数量。协变量与暴发动态之间的关系作为未观察到的混杂因素的代理变量，县的协变量可能与COVID-19爆发动态（输出）具有依赖性。例如，协变量相似性相对较高的县在确认病例数方面也可能具有较高的相似性如果存在这种依赖性，则意味着国家的协变量可能有助于捕获未观察到的混杂因素。在这方面，我们探讨这种依赖性是否存在于我们收集的县协变量，即，Google US上各县COVID-19相关搜索关键词的流行度。我们首先计算2020年所选县每日累计确诊病例数序列与全部391个县的二元相关性然后，对于这10个县中的每一个县，我们将其与391个县的二元相关值按升序排列。图11中报告了排名中每10个百分位数的平均双变量相关值（3a）。由于空间限制，我们在这里只解释我们使用的19个关键词之一的过程，“社会距离”。基于其他关键词也可以得出类似的观察结果对于每个县，我们将Google US上“社交距离”的每日受欢迎程度表示为2020年2月至12月的时间序列。然后计算基于其每日受欢迎程度的县之间的二元按照图（3a）中每行的相同排名顺序，我们在图中报告了每10个百分点的每日受欢迎度的平均双变量相关值。（3b）指数级。结果表明，大多数县对具有较高的双变量相关w.r.t. 爆发动态倾向于具有更高的关键词流行度相似性。这表明我们收集的协变量有可能帮助捕获混杂因素。网络与疫情动态之间的关系。网络也可能依赖于COVID-19爆发动力学，例如，距离相对较短或流动流量较大的县对，在确诊病例数上也可能有较高的相似性。与协变量和爆发动态之间的关系类似，这种依赖关系意味着网络在捕获混杂因素方面的潜在效用。因此，在这里，我们探讨是否存在这样的依赖关系，在国家之间的网络。按照图（3a）中每行的相同排名顺序，我们还报告了它们的距离的相应值，26810.80.70.60.50.40.30.2IjIj不.我i=1我一紧急状态非必要企业聚会健身房食物和饮料允许远程保健儿童保育（K-12）养老院娱乐户外和娱乐2期娱乐个人护理新阶段非必要企业礼拜场所户外和娱乐食物和饮料儿童保育（K-12）3期面向公众的企业2期3期任何口罩要求户外和娱乐健身房娱乐非必要业务旅行食物和饮料WWW(a) 社交距离(b) 重新开放(c) 屏蔽要求图2：2020年期间每个类别中具有政策类型的县的比例Albemarle，VAAugusta，VA Fairfax，VA Suffolk，MAPlymouth，MA Norfolk，MA Pulaski，VAWorcester，MAHampshire，MABristol，MA排名百分比10% 20% 30% 40% 50% 60% 70% 80% 90%排名百分比百分之十百分之二十百分之三十百分之四十百分之五十百分之六十百分之七十 80% 90% 100%排名百分比10% 20% 30% 40% 50% 60% 70% 80% 90%排名百分比百分之十百分之二十百分之三十百分之四十百分之五十百分之六十百分之七十百分之八十百分之九十(a) 各县确诊病例数之间的相关性。(b) 关键词流行度在不同国家之间的相关性。(c) 地理上的距离。(d) 县与县之间的流动量图3：反映所选县与其他县之间相互作用的图示：（a）不同县确诊病例数系列之间的双变量相关性，（b）不同县关键词流行度之间的双变量相关性，（c）县之间的地理距离，以及（d）县之间的流动流量（a）中每行的县按确诊病例数的二元相关性以升序排列，所有结果均按每10个百分点的县进行平均。（b）、（c）和（d）中的每一行都遵循与（a）中相同的县的顺序流动性流量（2月之间日和2020年平均（例如，距离网络）为At∈Rn×n，其中At图中每10个百分点（对数标度）（3c）和图。（3d），re-estimated. 我们得出以下结论：1）大多数县对是At中边i→j的权，如果不存在，则At=0具有相对较低的双变量相关性w.r.t.爆发死亡-县之间对于每个策略类型，我们使用Pt ={pt}n去-动力学更有可能有更大的距离比那些高注意这类政策是否在这些国家生效i=1相关性;2）大多数县对具有相对较高的双变量相关性w.r.t.爆发动态往往在它们之间具有较大的人类流动流量。这意味着收集的网络有可能捕获混杂因素。3时变因果关系评估在本节中，我们制定了COVID-19的因果评估县的时间段t，其中PT是1（处理的）或0（未处理的，即，续），根据政策类型是否在不管是不是第i郡在每个时间段，接受治疗的县形成对照县为对照组。在这里，我们指的是爆发动态的一种具体表现（例如作为确认病例的数量）在时间段t作为Yt={yt}n，也称为观察结果我i=1相关的政策类型作为一个因果效应估计问题，从观测数据。为了减轻这种评估的混淆偏见时间段t之前的变量用Xt表示. 合作的历史=（X 1，X 2，.，Xt−1），最后，我们开发了一个基于神经网络的框架来捕获治疗史Pt和网络结构A是时变混杂因素。3.1将政策评估作为一种因果关系来定义类似。然后，我们将时间段t之前的所有历史观测数据表示为Ht={Xt，t，Pt，Yt}效果估计问题我们考虑了T个时间段内n个县的COVID-19相关政策类型。不同的县由同一组协变量描述（即，特征）随时间变化，我们用我们对COVID-19相关政策的因果评估框架如下：从时变观测数据中估计因果效应的问题。我们的目标是调查原因（即，治疗，例如，有效的策略）将因果地影响结果（例如，确认病例的数量）（例如，一个县）.Xt={xt}n，其中xt表示第i个县的协变量不同的时间段。估计政策对以下方面的因果影响在时间段T（例如，在弗吉尼亚州Albemarle县，2020年3月期间，居民我们表示网络的邻接矩阵在时间段t的爆发动态，我们应该比较每个县爆发动态的潜在结果，如果这0.80.70.60.50.40.30.22.62.42.221.81.6×1031.4×1031.2×1031038×1036×1034×1032×10314121086有政策有政策有政策2682不⊕p我ˆˆˆ1.1，ii=00i i=作为所有县ITE的平均值：τt[τ t]。启发J J时间变化的混杂因素。请注意，CIDER不受限制月10，我我我我在E=Ei∈[n]我评估COVID-19相关政策的因果影响on Outbreak Dynamics：A Case Study in the USWWW我们假设混杂因素因果地影响当前时间段的治疗分配和结果，而先前时间段的治疗分配、结果和混杂因素也影响当前混杂因素。为了从随时间变化的观测数据中捕获混杂因素，我们首先使用递归神经网络（RNN）[37]从先前时间段的数据中提取有用的历史信息Ht=RNN（Ht−1，（Zt <$Xt<$Pt <$Yt）），（1）tt+1其中Ht是RNN中捕获历史的隐藏单元图4：我们研究问题的因果图政策在时间段t内已经/尚未生效。一般来说，潜在的结果[43，49]意味着临床信息，包括先前的治疗分配Pt（即，策略是否有效），结果Yt（即，确诊或死亡病例数），网络结构A（例如，距离网-意识到如果实例得到处理/控制，例如，“在3月，如果口罩要求政策在这段时间内生效/不生效，弗吉尼亚州Albemarle县的确诊病例数量会是多少？“. 我们用下式来表示如果该政策在时间段t生效/不生效，所有县的潜在结果：功）和观察到的特征Xt（例如，搜索COVID-19相关关键词的受欢迎程度）。这里表示连接操作。此外，为了更好地捕捉未观察到的混杂因素，我们还利用了图中国家之间的网络结构卷积网络（GCN）[28]。在每个时间段，我们学习Yt ={yt }n1和Yt ={yt，}n1。在我们的环境中，来自隐藏状态的结果yt是如果第i个实例在时间段t处于治疗P下时将实现的结果。然后，在时间段t的每个实例的个体治疗效果（ITE）[49]被定义为如果实例得到处理，如果它得到控制，在那个时期。在我们的问题中，时间段t时每个县的每个政策对疫情动态的ITE5是差异Ht−1，当前网络结构At和协变量Xt：Zt=AtReLU（At（Xt <$Ht−1）W0）W1，（2）其中我们堆叠两个GCN层以捕获未观察到的混杂因素与输入数据之间的非线性依赖性W0、W1是GCN层的参数At是归一化的邻接矩阵计算从At预先与renor-t t t t t ttt~t−1~t~t−1bet weent w o潜在结果：τi=E[y1，i−y0，i|xi，A，H]。[28]第二十八话具体地，A=（D）2A（D）2，其中然后计算时间段t的平均治疗效果（ATEA~t=At+In，D~t 为jA~jj。用这种方式，我们学习了表达通过以前的工作因果效应估计从时间演变数据[35]，我们为我们研究的问题设计了一个因果图，如图所示。4，其中每个箭头表示因果关系。我们表示时变（未观察到的）混杂因素（例如，居民代理变量;它可以使用更多的代理变量（如果提供），以提高性能。3.2.2平衡混淆因素的代表性。对于某些警惕性），Zt={zt}n。在本文中，我们使用较弱的版本，COVID-19相关政策，实施该政策的县（治疗i i=1组）和那些没有（对照组）往往有不同的根据未混淆假设[49]，通过假设可能存在未观察到的混杂因素，并以所有混杂因素为条件，治疗分配与混杂因素的分布。这种不平衡的分布可能会给因果效应估计带来额外的偏差[51]。因此，我们在每个时间段采用表示平衡技术潜在结果，即例如，yt ，ytpt|zt。与其他通过添加分布平衡约束，即月10，iiiLb在因果推理中常用的假设[24，48，49]，我们可以识别和无偏地估计在我们的问题中定义的ITE在图中的因果图下[34]这是一个类似的证明。3.2CIDER：评估COVID-19政策对疫情动态为了更好地估计COVID-19相关政策对每个时间段疫情动态的因果影响，我们开发了一个基于神经网络的框架CIDER，输入为随时间变化的给药组和对照组之间代表性分布的Wasserstein-1距离[51]。3.2.3用混淆表示进行预测为了训练捕获时变混杂因素的表示的模型，我们利用观察到的结果（即，爆发动力学）和治疗分配（即，策略的存在）作为监督信号。首先，我们使用两个多层感知器（MLP）f1和f0来预测潜在的结果：观测数据具体来说，CIDER学习以下内容的表示：于特=f1（zt），yt=f0（zt）.（三）在这些习得的表征上。3.2.1时变混杂因素的学习表征我们的框架从不同时间段的观测数据中捕获了随时间变化的混杂因素。如图四、5在[51]之后，我们在这项工作中以条件平均治疗效果（CATE）的形式定义ITE这样，每个实例的观察结果y i t（即，事实结果，例如，观察到的确诊病例数）和反事实结果（相反治疗的未观察到的结果，例如，如果政策与实际情况不同，可能的确诊病例数）。均方误差（ MSE ）被用作观测结果预测损失： Ly =Et∈[T] ，i∈[n][（y<$t−yt）2]。其次，我们还利用了XtPtZt的tYtXt+1Pt+1Zt+1At+1Yt+1时变混杂因素，并根据2683布里尔=y我–−我/打开/关闭我我我WWW表1：关于每个类别中所选政策类型的详细政策示例（包括制定这些政策的州这三个部分分别对应于社交距离、重新开放和面具要求的类别任务是训练混淆因素的表征具体来说，我们使用由softmax层激活的二进制预测模块。输出logitt估计得到治疗的概率，即，策略i在时间段t是否在县i中有效。十字架-治疗分配预测采用熵损失Lp=−Et∈[T]，i∈[n][（ptlog（lt）+（1−pt）log（1−lt））].（四）有关每个策略类别中具有特定目标的前5个最具影响力的策略类型的信息某些策略类型可能包含不同类别的策略例如，在表1中，对于类别重新开业，策略类型“阶段2”覆盖重新开业相关的策略，如“重新开业住宿场所”。对于面具类别，“第2阶段”涵盖了与面具相关的政策，如“强制学校使用面具”。5总结了我们对这些策略类型的ATE的估计图中的每一列 5对应于一个类别：社交距离，重新开放和面具要求。第一行和第二行分别显示了这些保单类型在确诊病例数和死亡病例数方面的估计ATE。我们从图中得到以下观察结果。第五章：在宏观层面上，关于社交距离和口罩要求的政策类型对确诊病例数和死亡病例数均具有负向因果效应，而关于重新开放的政策类型具有正向因果效应。这些负的因果效应值表明，相应的政策类型在因果上有助于减少COVID-19的传播，而具有正因果效应的政策类型可能会产生相反的效果，因为它们增加了感染的风险。这些观察结果在直观上似乎是合理的，也与关于COVID-19相关政策的现有文献一致[22，41]。在微观层面，我们放大到每个类别中在社交距离类别中，“聚会”和“饮食”政策类型似乎具有最强的影响。从这些政策的详细描述来看，它们有力地禁止了多个活动中的个人数量，特别是在餐馆等高风险场所类别中我们框架的总体损失函数是：L=Ly+αLp+βLb+λλθθ2，（5）其中α，β，λ是正平衡超参数，θ表示模型参数集在训练模型后，我们估计了每个县的COVID-19政策的ITE，在时间段t，作为预测电势和在口罩要求类别中，“第2段”和“任何口罩要求”最具影响力，因为它们要求在许多公共场所使用口罩。一般来说，上述观察结果对于不同的外部环境是一致的结果不月1不0，i并通过平均包括确诊/死亡病例的数量，以及不同时间段的此外，我们观察到，估计所有县的ITE。4实验评价在本节中，我们首先展示不同政策对2020年不同时间段疫情动态（确诊/死亡病例数）的估计因果影响。在此基础上，我们评估了这些政策在宏观和微观层面上的影响。然后，我们评估我们的框架方面的能力，控制混杂。我们还比较了不同的国家的最先进的方法估计的因果关系的影响作进一步讨论。Setup. 县被随机分配到60% 20% 20%的训练/验证/测试数据。结果是10次重复执行的平均值。我们将每个时间段的长度设置为15天，学习率为0。003，历元为2000，混淆表示的维数大小dz = 50，α = 1。0，β = 1 e 4，λ = 0。01.我们使用亚当优化器。4.1COVID-19政策的因果评估我们估计了2020年不同时间段不同政策对疫情动态的因果影响根据我们对平均治疗效果（ATE）的估计，表1显示了当疫情变得更严重时，例如在2020年底爆发期间，影响会更大。总之，上述观察结果揭示了及时采取政策限制人们在不同方面的密切接触（约6英尺内）的重要性，例如，距离、频率和某些身体部位（例如，在COVID-19等呼吸道流行病传播期间，此外，我们放大到县一级，并评估不同政策类型对每个县的疫情动态的ITE在图6中，我们随机选择了10个县作为示例，并显示了每个县不同政策类型的估计ITE为了比较不同的国家，每个结果都是从原始的ITE（如公式中所定义）计算出来的3.1）在所有时间段上求平均，然后通过相应县在最后时间段的确诊病例数进行归一化。从图6，我们观察到，每个县的三类政策的ITE通常与所有县的ATE具有相似的模式，即，“社会隔离”和“口罩要求”政策有利于控制COVID-19的传播，而“重新开放”政策则增加了风险。此外，这些政策在加利福尼亚州、纽约州和佛罗里达州等高风险地区的影响更大顶级策略类型示例策略紧急状态食品和饮料托儿服务（K-12）聚会限制面对面聚会（VA）限制去医院（OH）户外用餐，和交付只（RI）关闭公立学校（VI）聚会限制为10人（OH）2期娱乐户外和娱乐个人护理食物和饮料重新开放住宿机构（新墨西哥州）一些企业可能重新开放（ND）接触体育活动重新开放（OH）医疗保健可能重新开放（ND）重新开放现场餐饮（TN）任何口罩要求面向公众的企业食品和饮料3期2期在公共场所需要遮盖面部（IN）面对企业需要口罩（威斯康星州）餐厅需要口罩（MP）户外场所需要口罩（ID）K-12学校的强制口罩（UT）重新开放，政策类型的估计影响2684评估COVID-19相关政策的因果影响on Outbreak Dynamics：A Case Study in the USWWW(a) 社交距离，确诊病例。（d）社会距离、死亡案件。(b) 重新开业，确诊病例。（e）重新审理死亡案件。(c) 口罩要求，确诊病例。(f) 戴面具的要求，死亡病例。图5：2020年不同时间段不同政策类型的因果效应估计。这三列对应于社交距离、重新开放和口罩要求的政策类别。这两行分别对应于对确诊病例数和死亡病例数的估计因果效应。(a) 确诊病例（b）死亡案件。图6：不同政策类型对不同县疫情动态的因果效应估计。红色、黄色和绿色条分别对应于社交距离、重新开放和口罩要求的政策类别4.2学习混杂因素预测由于缺乏反事实结果，难以定量评价因果效应估计的性能。此外，基于学习到的混杂因素表征的暴发动态（out-come）和政策（treatment）的预测性能可以作为一个很好的指标来显示所提出的框架在捕获混杂因素和隐式评估因果效应估计的有效性方面的能力。在这里，我们比较了我们提出的框架与多个基线的预测性能和因果效应估计结果，包括最先进的因果效应估计方法，以及我们提出的消融研究框架的一些变体。基线包括：（1）ATE的朴素估计[49]-这种方法通过简单地采取治疗组和对照组中观察结果的平均值之间的差异来估计每个政策的因果效应。该方法可能存在混杂偏倚。（2）结果回归[49]-结果回归是因果效应估计中常用的方法。它将协变量作为输入，以预测每个治疗分配下的潜在结局。我们用线性回归实现它。（3）差异中的差异（DID）-DID [1]通过比较治疗组在每个时间段内结果的平均变化与对照组这是基于平行趋势假设[15]。(4) 因果效应变分自动编码器（CEVAE）[34]-CE-VAE是一种深度潜在变量模型，它从原始特征、观察到的治疗分配和实际结果中学习混杂因素的高斯分布表示。（5）反事实回归（CFR）[51]-CFR基于无混淆假设[49]学习混淆因素的表示，并基于学习的表示预测潜在结果。对于上述所有方法，我们分别处理每个时间段。（6）无网络（CIDER-NG）-在我们框架的这个变体中，我们删除了GNN模块以禁止该变体使用网络结构。（7）无时间（CIDER-NT）-在该变体中，我们移除基于RNN的存储器单元以禁止该变体利用时间信息。由于ATE、结局回归、CEVAE和CFR的基线Naive估计不能处理时间信息，因此我们在每个时间段分别使用它们。表2比较了不同方法在预测治疗分配（是否存在政策）和结局（确诊/死亡病例数量）方面的性能我们分别用后缀-dist和-mob表示基于距离网络和移动网络的框架。由于其他方法不模拟治疗预测，我们比较了我们的方法及其迦特喝食品和erings家园护理re（K-希尔德紧急状态n和娱乐户外护理d和饮料每Fooent2期娱乐喝食品和2期es电子商务公共面3期不要求任何掩模紧急状态第2阶段疗养院娱乐食品和饮料户外和休闲任何面具要求面向公众的企业食品和饮料32相相最终护理和饮料佩尔索食品（K-12）儿童保育聚会繁殖因果效应因果效应因果效应因果效应因果效应因果效应因果效应因果效应2685WWW表2：不同方法用于结果和治疗预测的性能比较（均方根误差结果预测精度治疗预测方法证实死亡SDRO马回归CEVAECFRCIDER-NTCIDER-NGCIDER-distCIDER-mob13145 3412236 1912577。4211540 94七五一82六五七44694. 48395. 83378. 25316. 46287. 9162岁41五十三54五十五25---0.8630。8810。9010。893---0.8720。8920。9010。901---0.8430。8690。8850。8745相关工作COVID-19政策的非因果分析各种研究调查了COVID-19相关政策[4，6，18，22，27，44]，包括其与家庭收入[5，46]，经济[21，50]和疫苗等多种社会和经济因素的关系。国家[38，40，52]。例如，一些研究[25]使用相关性分析或模拟方法来显示不同的COVID-19政策在控制这一流行病方面的有效性。另一项工作提出了一个概念框架[21]来分析非药物干预措施如社交距离将如何影响经济。然而，这些工作只能揭示政策和其他因素之间的统计依赖关系，而不是确定它们之间的因果关系。COVID-19政策的原因分析与统计角度不同，各种研究[22，31]估计了不同政策对COVID-19动态的因果影响。其中，一些工作[11]是基于结构因果模型（SCM）[23]。这些作品需要领域知识或因果发现方法[20] 以获得描述不同变量之间因果关系的完整因果模型。然而，它往往是困难的，以获得一个完整的因果图。在不假设完整因果图的方法(a) 确诊病例(b) 死亡病例。COVID-19相关政策的因果影响，通过比较治疗组随时间推移的平均结果变化，图7：通过不同方法计算的与屏蔽相关的政策类型的因果效应估计。治疗预测中的变量w.r.t.不同类别的政策类型结果表明，我们的框架可以在结局和治疗分配预测方面实现高性能，表明我们的框架可以很好地捕获混杂因素，如[51]中所讨论的通过比较我们的框架及其两个变体，我们观察到网络和时间信息都可以使这两种预测受益，这表明这些信息可以帮助捕获更多（未观察到的）混杂因素。4.3因果关系估计基准为了进一步研究我们的框架在捕获未观察到的混杂因素方面的能力，我们进行了以下案例研究：我们将掩码类别中的策略整合为一种处理，图1。7显示了不同方法估计的因果效应的比较我们观察到，几乎所有基线估计的结果随着时间的推移保持正值，这与我们的常识相冲突这种现象可能是由一些未观察到的混杂因素造成的，例如，处于更严重情况下的县的人民（例如，本身或邻近县的感染率较高）可能倾向于更早地采取口罩要求，而其他县可能不会如此警惕地采取这些政策。如果没有捕获混杂因素的有效方法（例如，目前的情况），一种方法可能会错误地将“戴口罩”和“确诊病例数高”之间的依赖关系视为它们之间的因果关系，并导致这种有偏差的估计。我们的框架可以捕获（未观察到的）混杂因素，因此可以提供与COVID-19的常识和流行病学研究更一致的估计[41]。对照组其他基于综合控制方法的研究[8，41]可以解释随着时间的推移不断演变的混杂因素的影响。尽管该等研究对COVID-19政策评估作出贡献，但其中大部分均基于有关存在未观察到的混杂因素的强有力假设。6结论在本文中，我们研究了评估各种COVID-19相关政策对不同美国疫情动态的因果影响的问题不同时期的县这里的主要挑战是存在未观察到的和随时间变化的混杂因素。为了解决这个问题，我们整合了来自多个COVID-19相关数据源的数据，这些数据源包含不同种类的信息，可以作为混杂因素的代理。我们开发了一个框架，利用关系和随时间变化的观测数据来学习混淆因素的表示基于学习的表示，我们评

下载后可阅读完整内容，剩余1页未读，立即下载