没有合适的资源?快使用搜索试试~ 我知道了~
∈et跨环境YuanY in1,IbrahimAy ed1,2,Emmanuel de Be′ zenac1,Patrick Gallinari1,31Sorbonne Uni versite',CNRS,LIP6,巴黎,法国2Theresis实验室,泰勒斯3Criteo AI Lab,巴黎,法国{yuan.yin,ibrahim.ayed,emmanuel.de-bezenac,patrick.gallinari}@ lip6.fr摘要从数据中自动学习自然现象的行为在过去几年中获得了很大的吸引力然而,在大多数真实世界场景中,获取数据样本的环境是变化的,并且对于每个数据样本可能不相同。这是由于不同的情况,例如在不同空间位置的采集,或略微不同的简单实验设置。这严重阻碍了培训过程,并使标准的学习框架不适用。在这项工作中,我们提出了一个新的框架,在这种情况下,我们能够利用不同环境中的数据,以学习底层的动态系统,确保泛化,而不损害模型我们实例化我们的框架上的两个不同的家庭的动力系统,证明我们的方法产生优于经典的学习方法,以及对竞争基线的结果。最后,我们还表明,我们也能够加速和改善以前从未见过介绍由于自然现象的组成元素之间存在复杂的非线性相互作用,使得建立描述自然现象的数学模型变得非常困难,在这种情况下,数据驱动方法可以从数据中自动学习未知的模型,从而成为传统建模方法的一种强有力的替代方法。最近,许多工作都集中在这个方向上(Giannakis和Majda 2012; Mangan et al. 2017),特别强调使用神经网络(Raissi,Perdikaris和Karniadakis2019; Chen et al. 2018; Ayed et al. 2019)来治疗基本过程基本未知的病例。尽管有希望的结果,这些方法通常假设一个理想化的设置,其中的数据是丰富的和环境中,它是获取总是相同的。然而,在实践中,这是从来没有的情况下,获得真实世界的数据样本可能是昂贵的。也许更重要的是,它们获得的环境可能会有所不同。这些版权所有© 2021本文由其作者。知识共享许可署名4.0国际(CC BY 4.0)变化可能由不同的因素引起:例如,在气候建模中,存在外力,如科里奥利力,其在不同的空间位置变化(Madec等人,2019),或者在心脏计算模型中,参数需要针对每个患者进行个性化(Neic等人,2019)。2017年)。在这种情况下,经典的学习范式是将所有数据视为独立和同分布的,从而忽略了环境之间的差异。由于该假设是无效的,它会导致有偏差的解决方案,并导致表现不佳的平均模型。相反,也可以选择通过分离来自不同环境的数据并分别学习每个环境的一个动力系统来避免做出这种假设。然而,这忽略了环境之间的相似性,并且会严重影响泛化性能,特别是在每个环境数据有限的设置中。在这项工作中,我们的目标是考虑到环境之间的差异,并利用它们之间的相似性。因此,我们提出了学习跨动态系统(LEADS)框架,一种新的学习方法,其中的动态被分解为两个组件,一个共享的所有环境中,和一个-其他考虑到动态,不能表示的共享组件,只有那些。这使我们能够自动利用来自类似环境的数据我们证明了我们的框架的有效性的两个标准的例子动力学给出的非线性方程:Lotka-Volterra捕食模型,表达为常微分方程,和格雷-斯科特反应扩散方程,表达为偏微分方程。最后,我们还证明了我们的方法可以加速和改善对类似未知环境的学习方法问题设置本文研究了利用不同环境下的数据学习未知物理过程的问题对于每个环境e E,我们假设数据由未知的控制微分方程生成:f(X)(1)Dt∈∈ ∈∈∈Σe∀ ∈克洛特2-是的ΣΣ --(四)伊克尔特ǁǁ→∞F克洛特00eS0定义在有限时间间隔[0,T]上,其中状态X是向量值,即我们有XtRd(实验部分中的Lotka-Volterra方程),或者是有界空间域上的d维向量场,即对于t[0,T]和x∈,Xt(x)Rd.如上所述,环境中的修改对系统的动力学有影响,并且因此期望演化项f e不同。然而,我们确实假设它们在环境之间产生某种形式的相似性:正如我们将在下文中看到的,这不是我们的框架适用的必要条件,但这将使我们能够利用这里的一般思想是,由于g对于每个环境都是相同的,因此可以使用所有环境中的所有数据点来学习。然而,这种分解产生了可能无限数量的解,特别是通过将g设置为空函数获得的平凡解:在这种情况下,不能利用跨环境的数据为了避免上述琐碎的解决方案,我们希望共享函数g尽可能多地解释动力学,并且反过来使环境依赖函数he尽可能小下面的约束优化问题包含了这个一般思想:其他环境的数据就像Arjovsky等人(2020),我们选择不丢弃收集数据的信息。我们构造ming,he∈F2002年9月2日受ee我我们的训练集具有训练样本(e,{X e,i}i=1,...,N)∈e,idXte,in(e,X)∈ D,=(g+h)(X)D. 因此,每个样本由环境标识符组成tdtetfiere以及一组轨迹,其中每个Xe,i,这里表示环境e中的第i个轨迹,是验证等式1的函数。相关工作为 了 使 预 测 性 能 在 不 同 环 境 下 保 持 不 变 , NEM(Arjovsky et al. 2020)旨在找到一种分类器,该分类器通过排除其他虚假环境相关的相关性来保持与不同环境无关的相关性。然而,在动力系统的背景让我们考虑极限情况,其中动力学在不同环境中是相同的,即e E,fe=f:这个目标将产生作为解的耦合(g=f,h=0),这意味着公共信息,这是所有存在的,将完全被g捕获,如预期的那样。这将有利于其泛化性能,因为所有数据都将被使用,即使是来自不同环境的数据。我们现在将实例化我们的方法,提供一个实际的实现来解决前面的目标。在实践中,我们不能在每个时刻都访问数据轨迹每个环境中的建模偏差与模型一样重要,t,但仅限于有限数量的快照{Xi}0≤k≤T/t因为它们都是不可预测的。这使得我们的设置不兼容。Spieckermann等人(2015); Bird和Williams(2019)使用以环境代码为条件的RNN来在时间分辨率下, 我们将所提出的目标的拉格朗日公式视为我们的训练损失。代替比较如等式3中的演化项,我们直接比较由这些引起的轨迹,而不是12:在不同的环境中进行有偏学习然而,环境之间的相似性并没有被明确地利用为共同的不变动力学信息。在测试时的鲁棒性方面,我们的公式与L(g,h,λ)=1λe∈Eǁheǁ+NeKi=1k=1e,ikt-Xe ,i2其中X∈ e,i =Xe,i+kt(g+h)(Xi)ds,它们是分布式鲁棒优化(DRO)。03 The Dog(2000)表明,在MLT中共同学习相关任务可以-可能导致比从每个任务单独学习模型更好的泛化。DRO方法,如Bi- etti et al.Staib和Jegelka(2019)认为,在一般的损失最小化中,对神经网络(或其他模型)施加一定的范数惩罚可以鼓励更好的泛化。拟议框架:LEADS由于方程(1)中的动力系统是未知的,我们将通过参数化演化来从数据中学习它们。从Xe,i开始的轨迹状态通过DE求解器其中g+he直到t=k<$t。注意,λ被视为除数而不是约束的乘数 这相当于优化原始拉格朗日函数,但当λ非常大时,对基于梯度下降的方法更友好。在实践中,利用适当的算法优化g,h和λ,当λ +时,我们应该达到最佳g和h e。然而,解决这样的优化问题是困难的,因为变化的λ不断地改变损失表面,这使得在动力系统的上下文中学习困难因此,我们将λ视为每个实验的超术语fe与神经网络,如Ayed et al.(2019);陈g的非零性,即使在这种情况下,方程3在最佳情况下不会完全满足等人(2018年)。现在的问题在于如何将这些术语实例化。我们考虑将动力学分解为两个分量,一个g ∈ F在环境中共享,和另一个环境依赖分量he∈ F,使得如果2F足够大,则它们应该存在一对需要注意的是,LEADS实际上与函数空间的选择无关。我们在这里选择神经网络的表现力,以验证我们的框架。可以将LEADS应用于由其他数据驱动方法表示的任何可行函数空间(g,he)∈F,通过它们的和,我们恢复动力学,[1]请注意,当趋向于时,两者是等价的。环境e的ics,即fe ∈E,fe=g+he(2)最大值02直接比较(近似)演化项是可能的,但会导致更差的结果。(三)多任务学习(Multi-Task Learning,MTL)e我0×22方法L-V(#E= 4)L-V(#E= 10)G-S(#E= 3)6.87e-61.26±1.21e-21.22±1.68e-26.43±3.42e-3铅没有最小。4.89e-63.33±3.14e-33.28e-63.07±2.58e-37.65e-55.53±3.43e-3导联8.15 e-62.36±2.16 e-37.63 e-61.77±1.58 e-38.60 e-53.38±3.31 e-3表1:Lotka-Volterra的LEADS和基线之间的比较(4和10个环境)和Gray-Scott方程(在3个环境中)。(a)(b)第(1)款图1:测试轨迹(蓝色)和地面实况(红色)之间的比较,以相空间显示蓝色轨迹由(a)Env预测。DEP. 和(b)Lotka-Volterra在4种环境中的电极导线(env. 从左到右为1到4实验简化方程(Pearson 1993)。管理PDE是:我们对两个复杂的非线性动力学系统进行了实验。第一个是常微分方程驱动的生物动力系统,第二个是偏微分方程驱动的拉乌Du=Du吉夫u−uv2+F(1−u)2反应扩散模型中,我们发现许多复杂的行为。t=Dv其中Xe=(ue,ve)是给定空间域中的状态,t t tLotka-Volterra方程我们考虑这个经典的模型(Lotka1926),常用于描述生态系统中捕食者和被捕食者之间相互作用的。动力学遵循以下方程:DxDy=αx−βxy,=δxy−γy周期性边界条件。D u,D v分别表示u和v的扩散系数,这是常数(Pearson 1993)。F和k一起定义了相应的模式和行为的类型 这意味着扩散项和反应项分别是非环境分量和环境分量。因此,我们选择参数θe=(Fe,ke),dtdt环境E来模拟数据。和洛特卡-沃尔泰拉一样其中x,y是捕食者和被捕食者的数量,α,β,γ,δ定义了两个物种如何相互作用。事实上,通过适当的重新标度,可以将β和δ吸收到x和y中。因此,我们通过在所有环境中设置β=δ= 1来保持β,δ不变,并让α,γ取决于环境。因此,两个物种之间的非线性相互作用是非环境分量,线性项与环境有关。因此,我们对每个环境e定义参数θ e=(α e,γ e)。注意,选择θ e决定了系统的第二个不动点(γ e,αe),轨迹围绕该不动点运行。系统状态为Xt=(xt,yt)。初始条件在环境中是固定的,即,X0=Xi. 从相同的初始条件开始方程,初始条件在环境中共享,并且我们模拟每个环境的一个轨迹用于训练和32个轨迹用于测试。步长为Δt=20,范围为T=KΔt= 200。实验在3种环境中进行。在每个方程的实验中,函数g、h是具有相同架构的NN。我们对Lotka-Volterra使用4层MLP,对Gray-Scott使用4层ConvNets 。 我 们 应 用 Swish 作 为 默 认 激 活 函 数(Ramachandran,Zoph和Le 2017)。这些网络的作品集成在时间上使用微分求解器实现陈等。(2018年)。相反,使用通过求解器内部的基本反向传播Xi=(xi,yi),我们只模拟每个环境的一个轨迹我们应用指数预定采样(Lamb et al.0 002016年),指数为0。第99章稳定训练我们32人参加了培训和考试。请注意,测试集比训练集大得多步长为Δt = 0。数据集范围为T=Kt= 10。实验在4和10个环境中进行。在 所 有 实 验 中 使 用 Adam 优 化 器 ( Kingma 和 Ba2015),具有相同的学习率1 10−3和(β1,β2)=(0.九,零。999)。对于作用于h我们选择max,其中e i,kéeGray-Scott方程这个反应扩散模型以其图灵模式和相对于其kté¨k∆t¨X e,i对应于训练样本轨迹。为了使测试数据的范数估计不偏离MSE列车MSE测试MSE列车MSE测试MSE列车MSE测试Env.独立。Env. DEP. 总和4.79e-17.00±1.71e-14.57e-17.32e-65.08±0.56e-11.55e-28.48e-51.43±0.15e-2l=1L(a)(b)(c)(d)(e)图2:来自(a)Env. DEP. 和(b)与(c)Grey-Scott方程的基本事实相结合。每一行代表一个环境。 我们示出了在t =0,. . . ,5 μT。 它们伴随着最右边时间步的预测误差图(d)Env。DEP. 和(e)铅。误差越大,对应坐标处的像素越亮。太多的训练数据,我们还惩罚了在每层的迭代时的自适应MSE测试50 250 500 10000L Whe2,相关Lipshitz常数,如Bietti et al.(2019年)。我们引入以下基准,以与建议的配方进行比较:• Env.独立。:两个环境无关神经网络g+h的和,用标准ERM学习Env. DEP. 总和从零开始Env. DEP. 单个0.25 3.05e-3学习原则,如Ayed et al. (2019)3,• Env. DEP. Sum:两个环境相关NN g e+ h e的和。• 铅没有最小。:我们的建议没有范数惩罚,相当于LEADS与λ=+∞。我们将结果显示在表1中。对于Lotka-Volterra系统,表2:在不同迭代下Lotka-Volterra的2个新环境在未知环境我们演示了学习的不变动力学如何在新的相似环境中提高拟合。我们假设首先,我们确认整个数据集不能被现在我们已经学习了一个变量函数g,用一对NN拟合(Env. 独立。). 与其他基线相比,我们的方法LEADS降低了近4/5的测试MSE由环境。DEP.当存在# E = 4个环境时,电极导线的测试MSE的总和和1/3。图1显示了测试中预测轨迹的样本,LEADS几乎与地面真实轨迹重叠,而Env. DEP. Sum在大多数环境中表现不佳。 当环境的数量增加到#E = 10时,相对于Env的误差切割超过85%。DEP. 总和和超过40% w.r.t铅没有最小值。对 于 Gray-Scott 系 统 , 。 LEADS 的 误 差 约 为 Env 的1/2。DEP.总测试MSE和60%的电极导线无最小测试MSE。在图2(a)-(c)中,用我们的方法获得的状态在质量上更接近地面真实。借助图2(d)和(e)中的错误映射,我们可以看到,在最右边的结束时间帧上,所有环境中的错误都系统地减少了这表明LEADS通过积分积累的误差较小,这表明LEADS消除了支撑上的过拟合。[3]我们选择了总和,因为它允许与我们的方法进行适当的比较。从L-V引出的导线(#E= 4)。然后,我们在新的环境Enew中生成另一个Lotka-Volterra数据集,在训练集中每个环境仍然有1个轨迹,在测试中有32个轨迹让我们考虑以下适应战略:• 不适应。:一个健全检查,以确保新的动态不能被预测的g*没有进一步的适应。• Env. DEP. Sum from scratch:两个环境相关NN的总和,从头开始训练,• Env. DEP. Single from scratch:一个依赖于环境的NN,从头开始训练,没有g的提升。• 铅提高了环境质量。DEP. 单:训练环境依赖的NN,它由学习的g加速。表2包含在训练迭代从50到10000的适应结果。 没有适应。本文首先指出,在这些新的病毒中,即使它们与原始病毒密切相关,单靠G-1也不能预测在迭代50处,我们观察到最后三个自适应如预期地表现不佳,因为它们处于训练的早期阶段 在迭代250中,LEADS提升了Env。DEP. 单超越已经从零开始的训练方法的最佳性能(环境。DEP. 总和和环境DEP. 在迭代10000时从零开始的单个)。这清楚地表明,不适应。- 0.36-Env. DEP. 单人1.6518.38.87e-24.13e-3LEADS提升0.732.06e-31.84e-31.11e-3学习的共享动态改进并加速了新环境中的学习。结论我们引入了一个数据驱动的框架LEADS,从一组相似但不同的动力系统中收集的数据中学习动力学。 用两个复杂的系统族证明,我们的框架可以显着提高测试性能在每一个环境中,特别是当可用的轨迹的数量是有限的。最后,我们证明了LEADS提取的动态可以促进类似新环境中的学习,这使我们在新环境中建立了一个更灵活的预测和泛化框架。确认这项工作部分由Locust ANR-15-CE 23 -0027和Chairesderechercheetd'enseignementenintelligenceartificielle(Chaires IA),DL 4Clim项目(PG)资助引用Arjovsky,M.;博图湖; Gulrajani,I.;和Lopez-Paz,D.2020. 不 变 风 险 最 小 化 。 ArXiv : 1907.02893 [cs ,stat]ArXiv:1907.02893.阿耶德岛 deBe'zenac,E.; Pajot,A.; Brajard,J.; 还有加里纳利P. 2019 年 。 从 部 分 观 测 学 习 动 力 系 统CoRRabs/1902.11136。Baxter , J. 2000 年 。 归 纳 偏 差 学 习 模 型 。 J. Artif.Int.Res.12(1):149-198。ISSN 1076-9757。Bietti,A.; Mialon,G.; Chen,D.;和Mairal,J. 2019。一个正则化深度神经网络的核视角。In Chaudhuri,K.;和Salakhutdinov , R. , 编 辑 , Proceedings of the 36thInternational Conference on Machine Learning,Volume97 ofProceedings of Machine Learning Research ,664-674. Long Beach,California,USA:PMLR.鸟,A.;和Williams,C. K. I. 2019.用多任务动态系统定制序列生成。CoRR绝对值/1910.05026。陈河,巴西-地T.问:Rubanova,Y.; Bettencourt,J.;Duve- naud , D.K. 2018 年 神 经 元 常 微 分 方 程 InBengio,S.; Wallach,H.; Larochelle,H.; Grauman,K.;Cesa-Bianchi,N.;和加内特,R.,编辑,神经信息处理系统,第31卷,6571Curran Associates,Inc.Giannakis,D.;和Majda,A. J. 2012.具有非线性和低频变异性时间序列的非线性拉普拉斯谱分析。美国国家科学院院刊109(7):2222ISSN 0027-8424。doi:10.1073/pnas.1118984109 。 网 址 https : //www.pnas. 或g/content/109/7/2222。Kingma,D. P的;和Ba,J. 2015。亚当:一种随机优化方法。In Bengio,Y.;和LeCun,Y.,编辑,2015年5月7日至9日在美国加利福尼亚州圣地亚哥举行的第三届学习表征国际会议上,ICLR 2015,跟踪程序。Lamb,A.; Goyal,A.;张玉; Zhang,S.; Courville,A.;和Bengio,Y.2016年。Forcing教授:训练递归网络的新ArXiv:1610.09038 [cs,stat]ArXiv:1610.09038。Lotka,A.J. 一九二六年物理生物学要素OGY 。 《 二 十世 纪 的 科 学进 展 》 ( 1919- 1933 ) 21(82):341-343。ISSN 20594941。http://www.jstor.org/stable/43430362.Madec , G.;Bourdalle'-Badie , R.; Chanut , J.;Clementi,E.; C oward,A.; Ethe′,C.; I o vino,D.;Lea , D.;Le'v y , C.; Lo-vato , T.; Martin , N.;Masson,S.; Mocavero,S.; Dallasset,C.; Escherk ey,D.; Vancoppenolle,M.; Muéeller,S.; 护士r,G.; 贝尔,M.;和Samson,G. 2019. NEMO海洋引擎。增加SI3和TOP参考手册。Mangan , N.M.; Kutz , J.N. 的 ; Brunton , S.L. 的 ; 和Proctor,J.L. 2017.基于稀疏回归和信息准则的动力系统模型选择。 英国皇家学会会刊A:数学,物理和工程科学473(2204):20170009。doi:10.1098/rspa.2017.0009。Neic,A.; Campos,F.的O.; Prassl,A. J.道:Niederer,S.一、Bishop,M. J.道:Vigmond,E. J.道:和Plank,G.2017.使用反应程函模型在人体全心脏模拟中有效计算电描记图和ECG。计算物理学杂志346:191 - 211。ISSN 0021-9991。皮尔逊,J.E. 1993.简单系统中的复杂模式。Science261( 5118 ) : 189-192. ISSN 0036-8075 。 doi :10.1126/science.261.5118.189。Raissi, M.; Perdikaris , P.; Karniadakis , G. E. 2019.Physics-informed neural networks:一个深度学习框架,用于解决涉及非线性偏微分方程的正问题和逆问题。计算物理学杂志378:686-707。Ramachandran,P.;Zoph,B.;和Le,Q.诉2017年。搜索激活函数。CoRRabs/1710.05941。Spiec kermann,S.; Düll,S.; Udluft,S.; Hentschel,A.;Runkler,T. 2015.利用递归神经网络在系统识别任务中的相似性。神经计算169:343 - 349。ISSN 0925-2312。学习大数据中的视觉语义理解ESANN 2014工业数据处理和分析。Staib,M.;和Jegelka,S.2019年。核方法中的分布鲁棒优化和推广。神经信息处理系统进展,9134-9144。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- BottleJS快速入门:演示JavaScript依赖注入优势
- vConsole插件使用教程:输出与复制日志文件
- Node.js v12.7.0版本发布 - 适合高性能Web服务器与网络应用
- Android中实现图片的双指和双击缩放功能
- Anum Pinki英语至乌尔都语开源词典:23000词汇会话
- 三菱电机SLIMDIP智能功率模块在变频洗衣机的应用分析
- 用JavaScript实现的剪刀石头布游戏指南
- Node.js v12.22.1版发布 - 跨平台JavaScript环境新选择
- Infix修复发布:探索新的中缀处理方式
- 罕见疾病酶替代疗法药物非临床研究指导原则报告
- Node.js v10.20.0 版本发布,性能卓越的服务器端JavaScript
- hap-java-client:Java实现的HAP客户端库解析
- Shreyas Satish的GitHub博客自动化静态站点技术解析
- vtomole个人博客网站建设与维护经验分享
- MEAN.JS全栈解决方案:打造MongoDB、Express、AngularJS和Node.js应用
- 东南大学网络空间安全学院复试代码解析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功