基于模型不可知元学习的区域自适应流感预测方案MARAPAS

130 浏览量更新于2024-01-17 收藏 1.16MB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

沙特国王大学学报基于模型不可知元学习的区域自适应流感预测文在寅、卢允娜、朴成宇、黄仁俊韩国大学电气工程学院，首尔02841，韩国阿提奇莱因福奥文章历史记录：2022年10月26日收到2022年11月15日修订2022年11月17日接受2022年11月23日在线提供保留字：人工神经网络深度学习元学习区域流感预测A B S T R A C T当有足够的数据可用于训练时，深度学习模型表现良好，但由于所谓的数据短缺问题，性能会迅速恶化。最近，模型不可知Meta学习（MAML）被提出来缓解这个问题，通过嵌入来自不同任务的公共先验知识到目标模型的初始参数。数据短缺在区域流感预测中非常常见，MAML也经常在区域流感预测中遇到困难，特别是当区域特定知识（如高峰时间或强度）变化时。在本文中，我们提出了一种新的基于MAML的流感预测参数调整方案，称为MARAPAS。该方案的基本思想是利用调整变量将由常识得到的初始参数调整到目标区域。我们的实验表明，MARAPAS优于其他基于MAML的方法，在均方根误差和皮尔逊相关系数。特别是，该方案提高了预测性能高达34%，与国家的最先进的计划。我们还展示了我们的方案的稳健预测准确性，并通过执行零触发COVID-19预测来证明其适用性。©2022作者（S）。由爱思唯尔公司出版代表沙特国王大学这是一个开放的访问CC BY-NC-ND许可证下的文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。1. 介绍流行性感冒是影响全世界许多人的主要健康问题之一。美国疾病控制和预防中心（CDC）估计，在2021此外，由于对感染的担忧，流感爆发降低了经济活动和生产力（Hilbert，2015），并使医院难以正常运营（Chowell等人，2007年）。减少这种损害的代表性方法是早期预测流感的发生，并提供预防、隔离和治疗所需的信息和时间（Chretienet al.，2014; Adadi等人， 2021年）。最近，已经提出了各种基于机器学习的预测模型来预测未来的流感爆发。在同等条件下-*通讯作者。电子邮件地址：ehwang04@korea.ac.kr（E. Hwang）。沙特国王大学负责同行审查当与传统模型（例如隔室和统计模型）相比时，基于深度学习的模型已经显示出出色的性能（Cheng等人， 2020年）。为了预测流感爆发，机器/深度学习模型采用基于历史流感发生数据和各种其他流感相关数据（包括互联网搜索和天气数据）的数据驱动方法然而，在许多情况下，这样的流感相关数据要么不可用要么不可靠（Cheng etal.，2020年）。因此，许多基于深度学习的预测模型仅使用历史发生数据（Cheng et al.，2020; Jung等人，2022; Moon等人，2021;Deng等人， 2020年）。然而，深度学习模型需要大量的历史数据来训练模型，以获得良好的预测性能。然而，流感的历史数据是每周收集的。因此，即使收集了很长一段时间的数据，可用的数据总量仍然不足（即，数据短缺问题）。在这种情况下，用少量数据训练的基于深度学习的流感预测模型很容易出现过拟合问题，这可能导致预测性能差（Moon等人，2020年a、2020年b）。最近，Meta学习（即，学会学习）已经成为解决数据短缺问题的突出方法之一元学习允许基于深度学习的预测模型从各种任务中学习公共知识由于https://doi.org/10.1016/j.jksuci.2022.11.0091319-1578/©2022作者。由爱思唯尔公司出版代表沙特国王大学这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。制作和主办：Elsevier可在ScienceDirect上获得目录列表沙特国王大学学报杂志首页：www.sciencedirect.comJ. 穆恩岛，澳-地诺赫，S.Park等人沙特国王大学学报176共同的先验知识，预测模型可以快速适应新任务的特定知识，即使数据量很小（Finn等人，2017年）。因此，Meta学习可用于提高基于深度学习的模型的性能由于这些特性，Meta学习被广泛用于各种领域，包括少镜头图像分类（Baik等人， 2021）、异常检测（Zhang等人，2020 a）和负荷预测（Xiao et al.，2022年）。在各种Meta学习机制中，模型无关元学习（MAML）是一种将共同先验知识嵌入模型初始参数的机制由于预先训练的参数初始化充当用于适应具有很少数据的新任务的良好起点（Finn等人， 2017），已经成为Meta学习的主流。MAML可用于区域流感预测，通过快速适应预测目标区域的特定知识区域流感预测的一个常识性例子是，在所有区域，流感的发生在特定季节达到高峰，在季节性流感开始之前几乎没有爆发然而，MAML往往无法概括关于区域流感预测的共同先验知识，这可能会降低测试阶段某些地区的预测准确性。当各地区在培训和测试阶段具有不同的具体知识或不同的流感发生模式时，泛化失败尤其常见（Baik等人，2021年）。为了解决这个问题，MAML中的初始化参数必须适应目标区域，以便可以利用区域范围的因此，在本文中，我们提出了一种新的基于MAML的参数调整方案-MARAPAS-调整初始参数从常识获得的流感预测的特定区域。该方案在学习公共知识的同时生成调整变量，并使用这些变量来调整预测模型的初始参数以适应目标区域。为了证明MARAPAS的有效性我们还分析了我们的方案预测精度的鲁棒性，并通过零触发COVID-19预测分析了其适用性本文的主要贡献归纳如下：我们提出了一种新的基于MAML的参数调整方案，以提高流感预测模型的性能我们展示了如何有效地将原始MAML应用于基于时间序列的预测任务。我们使用公共流感和COVID-19数据集比较了原始MAML和基于MAML的方案的预测准确性。本文的其余部分组织如下：第2节介绍了相关的工作;第3节介绍了所提出的模型;第4节介绍了实验设置;第5节显示了结果，最后，第6节总结了论文，并为未来的工作提供了方向。2. 相关工作2.1. 流感预测流感预测的传统方法是使用分区或统计模型。划分模型的一个典型例子是易感-感染-康复（SIR）模型，该模型首先将整个人群分为三组：易感组、感染组和恢复组。然后，它使用微分方程和预定义的超参数（包括传输率和恢复率）预测组之间的转换。例如，Zhang等人建立了一个基于SIR的时空风险评估模型来预测中国北京的流感传播（Zhang et al.，2016年）。他们首先分析了四个影响因素（生物、行为、环境参数和感染源）对使用SIR预测传染病趋势和特征根据分析，他们向政府机构和公众提供了建议Won等人提出了一种用于预测季节性流感发作时间的改良SIR（Won等人， 2017年）。他们修改了原始SIR模型的恒定传播率，使其随时间变化，以模拟流感的动态特征。他们还证明，他们的模型可以一致地预测流感季节的开始相比之下，统计模型通过将相关联的参数与历史发生数据或统计（例如，均值或方差）（Rout等人，2014年）。例如，Wang等人提出了一种动态泊松自回归（AR）模型，用于预测15个国家的短期流感样疾病（ILI）病例数（Wang等人， 2015年）。它们允许AR模型的变化随时间变化，并使用相似性图指定时间点之间的关系然后，他们表明，他们的模型所产生的预测结果始终优于传统模型所获得的结果。Perrotta等人在意大利使用线性AR模型进行每周流感预测（Perrotta等人， 2017年）。他们使用了基于医生报告的历史发生数据以及基于网络的历史发生数据，并证明使用这两种类型的数据可以改善流感活动的实时预测，而最近，机器/深度学习模型也被广泛用于流感预测，因为它们在各个领域中表现出出色的预测性能（Moon等人，2021; Moon等人，2020 a，2020 b; Wibowo andReichah，2022）.例如，Zan等人提出了一种基于深度神经网络（DNN）的甲型流感感染预测模型，称为DeepFlu，并表明他们的模型优于其他机器/深度学习模型，如卷积神经网络（CNN），随机森林（RF）和支持向量机（SVM）（Zan等人，2022年）。Rahman等人提出了一种数据驱动的两阶段机器学习模型，称为森林深度神经网络（fDNN），用于对流感进行建模（Rahman等人，2021年）。他们首先使用RF从患者的健康记录数据中检测特征，然后使用DNN来学习检测到的特征。他们对各种健康记录数据的准确率达到了90%左右2.2. MAML近年来，Meta学习作为解决数据短缺问题的一种方法，引起了人们的广泛关注在各种Meta学习方案中，MAML首先在（Finn etal.，2017），并因其优越的性能而成为Meta在MAML中，基于深度学习的模型的预训练初始参数基于从新任务获得的少量数据进行更新实验表明，MAML优于其他少次学习方案（例如，连体网、配套网等）当训练DNN用于回归、图像分类和强化学习时（Finn等人，2017年）。MAML可以解决数据短缺问题，但当任务多样化或训练和测试阶段显著不同时，由于泛化困难，它通常表现不佳（Baik etal.，2021年）。因此，已经做出各种努力来通过学习克服这一困难●●●J. 穆恩岛，澳-地诺赫，S.Park等人沙特国王大学学报177R我我我KK在不同的任务，以及任务特定的知识，这种方法被称为任务自适应MAML。例如，Xiao等人提出了一种任务自适应MAML框架，称为Meta ANN，用于短期负荷预测（Xiao等人，2022年）。该框架由基本模块和纠错模块组成.基本模块包含一个基于人工神经网络（ANN）的负荷预测模型，该模型使用大型历史数据集进行训练，以学习电网负荷的长期趋势和季节然后，纠错模块通过将学习速率调整到目标负载预测任务来微调基本模块通过使用比利时输电系统运营商的公共数据进行实验，他们表明，元人工神经网络的性能优于其他现有的预测模型，例如没有纠错模块的人工神经网络，长短期记忆（LSTM）和平均绝对百分比误差（MAPE）的线性回归。Baik等人提出了一种名为Metal的Meta学习框架，用于少量图像分类（Baik等人， 2021年）。Metal由两个元学习器组成：一个用于学习损失函数，另一个用于生成转换学习损失函数的参数他们证明了Metal在少数镜头图像分类（5路5镜头和5路1镜头）和少数镜头回归方面优于现有的少数在区域流感预测、区域特定知识、例如流感发生高峰时间、发病时间和高峰强度，在不同地区之间差异很大。然而，我们发现传统的任务自适应MAML方法调整了训练过程（例如，学习率和损失函数），而不是直接调整参数。因此，区域性流感预测可能具有挑战性，特别是在预测一个区域内不可见的高峰强度时，这对政策制定很重要。为了克服这一缺点，有必要直接针对某一区域调整预测模型的初始参数，以更好地学习该区域的具体知识，提高预测精度。3. 该模型在本节中，我们正式定义了区域流感前-如果历史数据不足，则由于不适当的学习，它们的预测性能显著下降（Moon等人，2020年a、2020年b）。流感发生数据通常收集在每周一次。因此，如果我们每周收集10年的数据，我们只能获得大约500个数据点。换句话说，区域性流感预测很可能因缺乏数据而受到影响。MAML已经成为解决数据短缺问题的强大解决方案，可以增强各种深度学习模型的性能。由于这些有利的特征，MAML已被广泛用于许多领域，包括图像分类（Finn等人，2017）、负荷预测（Xiao et al.，2022）和异常检测（Zhang等人，2020年a）。因此，我们希望MAML能够解决区域影响中固有的数据短缺问题。预测也是如此。如图1所示，MAML由两个阶段组成：Meta学习和自适应。在前一阶段，跨任务的共同先验知识被编码到预测模型的初始参数。这种初始化作为一个良好的起点，有助于预测模型在后期快速适应看不见的目标任务。图2显示了我们提出的方案的总体结构。通过Meta学习和自适应，该预测模型能较好地预测目标区域的ILI.更具体地，在Meta学习阶段，获取关于输入区域中的流感发生的共同知识并将其编码到参数中。可能的常识的例子是：所有地区的流感发生在一年中的特定季节达到高峰，或者在季节性流感发作之前几乎没有爆发（Adhikari et al.，2019年）。在原始MAML中，该阶段由使用Occi的两个循环（内环和外环）来实现，即，区域i的ILI发生数据。在内部循环中，LTifh;Occi表示和首先使用公式（2）计算Occi中的损失。然后通过等式（3）基于梯度h来更新模型fh的参数h。该参数表示可以减小损耗LTifh;Oc cif的方向。这个循环的输出是hi，它是区域i的更新参数。在外循环中，在新的随机选择的示例（X t'，y t'）2Occ上评估模型，以铸造问题和描述MAML在流感预测的制度。3.1. 问题公式化我们制定流感预测作为一个区域性的时间序列预测任务，使用ILI患者计数数据。此后，为方便起见，ILI表示ILI患者的数量byt。Xtf. xit-T-1;· ··;xit-1;xit1我我对模型的泛化性能给出反馈，使用等式（4）更新每个任务h0i的权重。反馈用于更新所有区域的初始化h，使得如等式（5）中所描述的那样实现常识的更好概括。更详细地解释等式（3）和（5）可以在（Finn et al.， 2017年）。在方程中，a和g分别表示内环和外环更新的学习速率。预训练的初始参数h用于自适应阶段X. .ΣΣ不我们假设对于N个不同的区域（例如，城市或州），S任务表示一组任务T1，. . .，TN，其中每个任务Ti要预测区域i中的ILI，并且T目标表示预测目标区域中的ILI的任务每个任务基于过去T个时间单位中的ILI预测h个时间单位后该区域中的ILI因此，T对应于输入数据中的时间长度，h对应于水平/提前时间，即，要预测的时间单位的数量此外，其中，xt和X表示在时间t处区域i中的ILI，并且在时间t处区域i中的ILI的集合表示在时间t处区域i中的ILI。LTifh;OcciXt;ytLfhXk ;ykð2Þ我我在过去的T个时间单位期间，分别在区域i中基于这些符号，等式（1）定义了区域i的预测任务，其中f是基于深度学习的预测模型。本节中未定义的符号将在后面详细描述。3.2. MAML用于区域流感预测基于深度学习的模型需要足够的训练数据来实现良好的预测性能。的量是否图1.一、MAML算法图不J. 穆恩岛，澳-地诺赫，S.Park等人沙特国王大学学报178B我我n oB我目标HHh0i¼h-arhLTifh;Occi3以及2）根据适合性的初始参数的调整量.100美元。 .t0我t0确定初始参数h对区域的适用性RLTi fh0;Oc ci¼Lfh0i XiN;yið4Þi，我们使用梯度hLTifh;Occi，遵循先前的工作，使用梯度作为Meta信息（Mitchell和Sebastian，1993; Younger等人， 1999年）。文件，通常用于更新h←h-grhXLT.fh0;Occi05在适应阶段，模型学习目标区域的区域特定知识。根据不同地区，感染发生高峰时间、发作时间和峰值强度可能不同。MAML允许模型从公共知识开始学习这些特定的知识。因为常识是一个很好的起点（即，初始化），模型可以快速适应目标区域的特定知识。在这个阶段中，我们使用Occ目标，其中预训练参数h从Meta学习阶段获得。我们仅使用几个微调梯度更新步骤来导出参数hωtarget，其适应于目标区域，如等式（6）中所述。hω<$h-arLf·6当对目标区域的适应完成时，所获得的训练模型fhωtarget 可以预测未来流感的发生具有梯度下降的参数，包含区域特定的信息和区域初始参数h在优化方面。因此，我们利用区域i的梯度作为初始参数对该区域的适合性，并使用梯度作为信息来产生新的区域-基于初始参数的自适应参数hi接下来，为了确定初始参数的调整量，我们构建了一个模型，该模型可以找到一组最佳调整。在这里，我们使用两个回归模型g£x和g£b来产生区域自适应初始参数，该参数可以是该区域的初始最优参数。在我们的实现中，我们设置g£x和g£b （分别由εx和εb参数化）作为2层DNN网络。该模型以区域i的梯度作为输入，生成两个区域自适应调整变量xi和bi作为输出。这里，xi和bi作为权重和偏置，用于使初始参数h适应区域i;等式（7）、（8）和（9）表示这些步骤。这里，xi^nxjo，在那个地区。3.3. 区域自适应参数调整当整个区域共享许多公共知识并且公共知识可以应用于目标区域时，初始化原始MAML中的参数可以是一个很好的然而，一个地区的知识越是多样化，就越难获得可以普遍化的共同知识。在这种情况下，由于目标区域的具体知识与这种常识相距甚远，因此难以适应目标区域（Baik等人，2021年），这可能会严重降低预测精度。为了解决这个问题，我们计算一个新的区域参数h为每个区域的基础上，根据局部适用性的初始参数h我们称这个过程为区域自适应参数调整。由于新的参数考虑了区域特定的知识，以及共同的知识，一个更好的预测性能相比，原来的MAML。图3显示了我们的方案与原始MAML相比的整体过程为了实现我们的区域自适应参数调整，我们需要确定1）初始参数h对于bi¼BJ是区域i对于预测模型参数hi的第j层，为了生成这些变量，每个回归网络都需要一个合适的激活函数。首先，当权重衰减或放大初始参数时，我们使用ReLU作为g∈x的激活函数以输出xi> 0。第二，由于偏差是从图3.第三章。MARAPAS算法与MAML算法的比较图图二.拟议的基于MAML的区域流感预测方案的总体结构。1/1我J. 穆恩岛，澳-地诺赫，S.Park等人沙特国王大学学报179(a) 美国地区数据集(b) 日本都道府县数据集图四、美国和日本数据集中使用的10个地区的Boxen图J. 穆恩岛，澳-地诺赫，S.Park等人沙特国王大学学报180-n o.ΣBb我¼我£bH我我HH我我HH我h;£x;£b1/1我我nBn0P.A n-Ab。Fn-bFend while加权参数，我们使用tanh作为激活函数，以输出1和1之间的bi。对所有区域执行此操作。算法1描述了整个学习过程。图5（a）和（b）示出了具有最不同分布的两个区域的ILI发生（即，最小的皮尔逊系数），分别在我们的实验中，我们将ILI值归一化，x<$Nxjoj <$1···l <$4 g.R2016年6月27日使用最小-最大归一化从0到1的所有区域。然后，ii£xb1···lg. RhLTihi2016年6月28日我们利用前50%的数据作为训练数据，而其余50%作为测试数据。在这里，我们使用Meta学习和适应阶段的训练数据，并使用测试数据用于评估预测精度。jj j jbhi¼xihbi94. 实验设置为了评估我们的方案的有效性，我们使用开放数据集进行了广泛的实验。在描述实验结果之前，我们首先介绍了比较模型的数据集、4.2. 评估指标我们利用流感预测中的两个流行指标，即均方根误差（RMSE）和皮尔逊相关系数（PCC），来比较模型的预测性能（Jung等人，2022;S. Deng等人，2020年; Y. Wu等人，2018年）。RMSE表示将归一化值投影到实际范围后实际值和预测值之间的平均差。因此，较低的RMSE意味着预测模型更算法1提出的元学习阶段输入：一组Meta训练任务S任务，学习率a;g输出：具有元模型的预训练Meta参数h设h¼HJ 其中j是层索引，l是网络而Meta学习时期对于所有区域N都是如此。计算LTifh;发生率i为每层生成调整变量x和b：. xjj1···lgJ.RLOccurrencebj<$1···l<$4g.RL计算调整后的初始参数：jj j.bjj¼1···lhi<$xihbi初始化hi<$hi计算LTi.fh0i;Occi使用梯度下降计算自适应参数：h0i¼h-arhLTifh;Occi计算L Tfh0;发生率i0我我端对于外循环更新的数量，使用梯度下降更新参数：.h;£x;£b←.h;£x;£b-grPN LT.fh0;Occi0结束，4.1. 数据集实验中使用的两个数据集是：美国地区（疾病控制和预防中心数据集）：我们从CDC收集每周报告的ILI数据。美国卫生与公众服务部（Department of Health andHuman Services，HHS）根据地区间的相关性将美国分为10个地区。该数据集包含从2002年第1周至2022年第6周（1050周）这10个HHS地区的ILI患者计数。● 日本-都道府县（国立传染病）：准确RMSE可以通过等式（10）计算，其中NPCC表示预测值与实际值之间的线性相关性。因此，较高的PCC表明该模型可以更准确地预测流感爆发的趋势，包括发病和高峰时间。PCC可以定义为其中A和F分别是实际和预测ILI的平均值。我们还使用了公式（12）中定义的归一化RMSE（NRMSE）。这里，max（An）和min（An）分别表示An的最大和最小ILIrnn2我们每周从传染病中心收集ILI患者，RMSE¼1XN0A-Fð10Þ日本47个都道府县（例如，东京和京都）从2012年第31周至2020年第20周（408周）。表1列出了数据集的统计数据，PCCN0n1n0的n1我是一个很好的朋友。ﬃﬃ ﬃAﬃﬃﬃﬃﬃ ﬃ—ﬃﬃﬃﬃ ﬃAbﬃﬃ ﬃΣﬃﬃ ﬃ2ﬃﬃrPﬃﬃﬃﬃﬃ ﬃNﬃ ﬃ0ﬃﬃﬃ ﬃ.ﬃﬃﬃFﬃﬃﬃﬃﬃ-ﬃﬃﬃﬃﬃbFﬃﬃﬃΣﬃﬃﬃ2ﬃﬃð11Þ平均值、最大值和标准差。我们还提出了区域统计的最小值和最大图 4n1nRMSEn1n(a) 及（b）显示美国使用的十个地区的箱线图地区和日本都道府县数据集。此外，本发明还提供了一种方法，NRMSE最大值±100A±100 A±12A●hLTi£x我不是£b我不是J. 穆恩岛，澳-地诺赫，S.Park等人沙特国王大学学报表181181(a)美国地区数据集数据集摘要。数据集总统计区域统计（最小值-最大值）平均Max标准偏差平均Max标准偏差美国地区1410.7843,1972,326.19312.15-3,453.084,409-43,197495.15-4,661.31日本都道府县615.0426,6351,620.84149.21-2,116.291,523-26,635278.45-4,276.454.3. 实验设置为了比较，我们考虑了五种学习方案：DNN、迁移学习、MAML、元ANN（Xiao et al.， 2022）和金属（Baik等人，2021年）。其中，DNN仅使用目标区域的发生数据进行训练。对于迁移学习，我们使用所有地区的发生数据预训练预测模型，并使用目标地区的发生数据进行微调。此外，我们实现了如第3.2节所述的原始MAML，并且对于任务自适应MAML方案（元ANN和Metal），我们遵循如（Baik et al.，2021;Xiao等人， 2022年）。尽管这些学习方案可以用于训练各种基于深度学习的预测模型（Zhang et al.，2018年，2020年b），我们使用DNN作为预测模型，该模型已广泛用于各种预测领域（Xiao et al.，2022; Zan等人，2022; Fereydooni等人，2012; Li and Liao，2017）。这是(b) 日本都道府县数据集图五.美国和日本数据集中分布最不同的两个地区的ILI发生率。因为DNN的简单结构使得很容易识别MAML对预测性能的影响。为了公平比较，我们对学习方案使用了相同的超参数值。输入时间单位T的窗口大小、批量大小、学习速率（a和g）以及外循环更新的数量分别被设置为20、32、0.0001和5。预测模型DNN由三个隐藏层和每层中的十三个感知器组成，这大约是根据（Moon等人，2020年a、2020年b）。此外，Meta学习（transfer learning的预训练）和自适应的时间分别设置为300和1。所有学习方案的损失函数是实际ILI和预测ILI之间的误差。我们通过执行10个预测并平均其RMSE和 PCC 值来衡量预测准确性。此外，我们使用 Python 3.7.3 和Tensorflow实现了所有比较方案（Abadi et al.， 2016）和PyTorch（Paszke等人， 2019年）。5. 实验与讨论为了评估MARAPAS的有效性，我们使用两个开放的ILI数据集和COVID-19数据集进行了实验我们首先从定量和定性两个方面比较了预测性能接下来，我们研究了Meta学习区域的数量和训练数据的数量对预测性能的影响最后，我们将MARAPAS应用于COVID-19病例的零射击5.1. 预测性能在这个实验中，我们比较了h= 5时五种学习方案的定量预测性能。表2和表3列出了来自两个数据集的10个区域的结果。在表中，粗体和下划线值分别表示每个区域的最高准确度和第二高准确度。表2显示了这些方案在美国区域数据集上的预测性能。从表中我们可以看出，MARAPAS在所有情况下都取得了最佳性能有趣的是，原始MAML和迁移学习在所有情况下都优于然而，在大多数情况下，迁移学习的准确性高于MAML。然而，任务自适应MAML计划，如元人工神经网络和金属，和MARAPAS 表现出色。这意味着基本MAML的性能对于区域流感预测并不令人满意，因为区域的知识是多样的。在这种情况下，任务自适应MAML方案可以产生更好的结果。此外，在任务自适应MAML方案中，我们的方案根据区域的状态直接调整参数，而METAL使用任务自适应损失函数，而元ANN使用任务自适应学习率。由于MAML将先验知识编码到参数中，因此与MARAPAS中相同，直接调整参数似乎更适应于不同的区域特定知识。与次优方案相比，本方案的相对增益达到34.3%。表3列出了日本-Prefectures数据集，表明这些结果与US-Regions数据集的结果相似。MARAPAS排名第一，J. 穆恩岛，澳-地诺赫，S.Park等人沙特国王大学学报表182182在美国地区数据集上的实验结果。区域RMSE表3日本都道府县数据集上的实验结果。区域RMSE见图6。使用美国地区数据集比较实际ILI和预测ILI的结果。DNN转移MAML元人工神经网络金属玛拉学习PAS11665.091555.841481.711395.591172.141064.762488.83376.37354.93361.90300.55305.34图7.第一次会议。实际ILI和使用日本-3522.30438.10423.12410.75336.01262.70县数据集。41007.62764.72802.61827.56670.415398.64377.71371.26281.81268.97196.55tion（1 620.84），相比与的美国地区数据集6378.39298.10285.62266.48281.92198.93（2 326.19）。MAML似乎表现良好时，标准设备-7755.37582.80550.65518.41524.36396.95由于区域特定知识的多样性低，81216.92836.49815.13776.20709.95668.63边缘我们的方案的相对增益，与9707.49575.55552.49601.16527.13494.29次优方案，为29.4%。10861.01607.14611.58598.86542.33509.96综上所述，MAML更适合日本都道府县区域PCC数据集。然而，即使对于US-Regions数据集，DNN迁移学习MAML元人工神经网络金属马拉帕斯10.6740.7330.7610.7950.8530.89320.6070.7900.8190.8140.8810.88530.6310.7580.7820.7930.8790.90340.5020.7640.7240.7010.7870.85950.6820.7530.7480.8680.8960.91560.5980.7830.7940.8250.8750.91070.6530.8350.8600.8790.8990.91380.5630.8320.8390.8570.8130.91190.4920.7070.7360.6730.8050.830100.5480.8080.8090.8150.8510.878除了区域2中的RMSE之外的情况。即使在这种情况下，我们的计划取得了第二好的性能，并优于金属在PCC方面与美国地区不同，基本的MAML在大多数地区都表现出迁移学习。根据表1，日本都道府县数据集的标准偏差相对较低具体知识的每个区域不同重要的是，任务-自适应MAML（特别是MARAPAS）方案可以显示出突出的预测性能。5.2. 预测性能在这个实验中，我们通过将结果与实际ILI数据进行比较，可视化了MARAPAS、MAML和DNN方案的预测结果。图图6和图7分别显示了美国地区和日本都道府县1区测试期最后四年的结果。在美国区域数据集的区域1中，ILI的爆发模式从训练期到测试期突然改变。因此，如图6所示，DNN的预测结果只是跟随ILI的趋势，并且在预测峰值时间或峰值强度方面存在困难。另一方面，当MAML学习跨区域的共同知识时，它显示出比DNN更好的结果此外，由于区域自适应参数调整，MARAPAS在预测峰强度方面表现出图7示出了与图7类似的结果。DNN转移MAML元人工神经网络金属玛拉学习PAS12153.181238.21967.84949.27887.82618.9223396.272728.792850.012224.561989.791627.8333849.092450.052656.642489.512206.042066.7248011.637599.896180.484351.104474.732856.6652468.181548.961806.861365.861159.11828.0162506.181922.171973.661941.451708.851262.297696.02403.30431.90408.15381.69300.7581578.45892.09894.95693.52680.79492.459841.35874.91817.53734.54606.10514.4210937.40717.52752.18548.93516.48395.78区域PCCDNN转移MAML元人工神经网络金属玛拉学习PAS10.2650.7410.7650.7440.8280.88020.3130.6110.6460.5810.6930.78930.4040.7610.6460.6630.6760.78440.3890.6210.6070.7320.7280.88950.4070.8100.7820.7850.7450.89460.5420.7650.7740.7810.7770.92570.4970.7700.7070.7820.7330.84380.3320.7700.7170.8100.7790.88390.6800.7120.7590.7710.8300.852100.4040.6780.6050.7120.7260.871J. 穆恩岛，澳-地诺赫，S.Park等人沙特国王大学学报183表4使用日本都道府县数据集的Meta区域RMSENPCCN102047（全部）102047（全部）11083.471089.271064.760.8620.9010.8932326.18311.41305.340.8970.8670.8853321.85271.56262.700.8810.8990.9034702.72689.16636.480.8040.8090.8595268.39220.09196.550.8840.9040.9156280.15230.09198.930.8500.8930.9107541.82458.33396.950.8560.8920.9138803.34787.19668.630.8030.8390.9119530.11507.42494.290.7760.8240.83010573.22556.29509.960.8410.8600.878表5当使用1年的训练数据时，对美国地区数据集的预测结果区域RMSEPCC迁移学习MAMLMARAPAS迁移学习MAMLMARAPAS11318.321135.80878.010.6020.6040.80523426.453538.821810.680.6420.5680.76633624.133615.102403.780.5780.5760.68347026.286366.434696.790.4460.4550.76852000.592153.76987.130.7050.6610.79462249.1452368.361923.580.6120.6210.7797535.29541.86397.800.5340.5310.72481048.901152.57691.650.6800.6240.8209942.10979.14614.110.6350.6350.78710752.76804.21538.380.5840.6060.731表6COVID-19疫情零爆发预测的比较结果在上一节中，我们使用了一半的数据（大约500个数据点）用于训练，另一半用于测试。这一次，我们只使用了一年表5显示了迁移学习、MAML和MARAPAS的预测结果与使用整个训练数据的情况相比（表2），由于数据不足，MAML和迁移学习的预测精度急剧下降另一方面，MARAPAS仍然保持类似或更好的预测性能。5.4. 应用于零射击COVID-19预测为了评估MARAPAS的适用性，我们将其应用于COVID-19的零射击预测。零发射预测利用已经在其他任务上预训练的预测模型来预测目标任务。换句话说，MAML没有适应阶段。由于零射击学习不需要目标任务的历史数据（在本实验中，COVID-19病例），因此它可以用于预测新出现的传染病，因为没有足够的历史数据可用于训练。因此，我们可以使用用其他ILI数据集预训练的预测模型来预测未来的COVID-19病例。我们首先使用ILI数据集的整个周期用MAML方案的Meta学习阶段训练预测模型。预训练的预测模型随后直接用于COVID-19预测;未执行使用COVID- 19数据的适应阶段。全球COVID-19病例数据来自我们使用2020年1月28日至2022年4月12日的每周汇总数据进行测试。RMSE不适合进行比较，因为在此期间全球确诊病例的平均数量超过3000万。相反，我们使用NRMSE和PCC作为评估指标。表6显示了我们的方案与迁移学习和MAML的比较;在这种情况下，我们假设新的大流行情况，其中COVID-19数据不存在。的粗体值表示最高精度。在这里，我们的方案表现出最好的预测性能，表明它可以应用于新的流行病情况。在美国地区数据集中。MAML在预测峰值时间和峰值强度方面优于DNN，MARAPAS在预测峰值时间和峰值强度方面优于DNN。5.3.敏感性分析在这个实验中，我们研究了超参数对预测性能的影响。首先，我们测试了所提出的方案对N个Meta学习区域的敏感性。表4显示了N在10、20和47之间变化时日本都道府县数据集的实验结果。在该表中，N= 47的结果与表3中的结果相同，表3示出了当数据集的所有区域用于Meta学习时的结果。粗体值表示最佳性能。从表值来看，N值越大，预报精度越高.这意味着基于MAML的方案可以实现更好的预测精度，因为它们从更多的区域学习知识。然而，如表3所示，在大多数地区，与最先进的（SOTA）基于MAML的方法相比，MARAPAS显示出更好的准确性，即使对于小的N。其次，我们分析了数据点数量对使用美国地区数据集进行预测准确性培训在6. 结论在本文中，我们提出了一种新的基于MAML的区域自适应参数调整方案的区域流感预测。该方法利用初始参数在每个区域上的

下载后可阅读完整内容，剩余1页未读，立即下载