地球科学中的神经网络技术应用于波形数据处理的新方法

10 浏览量更新于2023-12-06 收藏 15.32MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

1. Introduction0地球科学中的人工智能3（2022）101-1140根据CCBY-NC-ND许可的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。0目录列表可在ScienceDirect上找到0地球科学中的人工智能0期刊主页：www.keaipublishing.com/en/journals/artificial-intelligence-in-geosciences0原始研究文章0MLReal：弥合机器学习中合成数据和真实数据应用之间的差距0Tariq Alkhalifah�，Hanchen Wang，Oleg Ovcharenko0物理科学与工程，沙特阿拉伯阿卜杜拉国王科技大学，邮政信箱＃1280，Thuwal 23955-69000文章信息0关键词：神经网络诱发地震图像处理计算地震学波形反演0摘要0在利用在波形（即地震、电磁或超声）数据上训练的神经网络时，我们面临的最大挑战之一是将其应用于真实数据。准确标签的要求通常迫使我们使用合成数据来训练我们的网络，其中标签是readilyavailable。然而，合成数据通常无法捕捉到现场/真实实验的真实性，我们最终会发现经过训练的神经网络（NNs）在推断阶段表现不佳。这是因为合成数据缺乏真实数据中嵌入的许多现实特征，包括准确的波形源特征、真实噪声和准确的反射率。换句话说，真实数据集远非合成训练集的分布样本。因此，我们描述了一种增强我们在合成数据上监督神经网络（NN）训练的新方法，该方法使用真实数据特征（域适应）。具体而言，对于输入部分的垂直轴（时间或深度）的绝对值对于预测不是至关重要的任务，如分类，或者可以在预测后进行校正的任务，如使用井进行速度模型构建，我们建议对网络数据进行一系列线性操作，以便训练和应用数据具有相似的分布。这是通过对输入数据到NN的两个操作来实现的，无论输入来自合成还是真实数据子集域：（1）输入数据部分（即，射线收集、地震图像等）与输入数据部分的固定位置参考跟踪的互相关。(2)结果数据与另一个子集域的自相关部分的均值（或随机样本）的卷积。在训练阶段，输入数据来自合成子集域，自我校正（我们将每个跟踪与自身进行互相关）的部分来自真实子集域，并且从真实数据的随机选择在每个训练时期实施。在推断/应用阶段，输入数据来自真实子集域，自相关部分的均值来自合成数据子集域。在被用于演示此方法改进我们训练的NN对真实数据的适用性的示例应用中，被用于微震事件源定位的被动地震数据和用于预测低频的主动地震数据。0在尝试发现地球地下构造时，通过反演其物理特性的测量，我们开发了手工制作的（固定的，其中它们的元素没有经过优化或学习）算法来执行各种任务，如去噪、成像、反演等（Bourgeois等人，1989年）。这些手工制作的（固定的）算法独立于数据中的特定特征，并且通常需要进行新的研究来更新这些算法，以适应数据的任何演变（或限制）。最近，数据驱动方法已经成为用神经网络（NNs）替换固定算法的主要方法，这些神经网络经过训练可以执行特定任务。机器学习（ML）作为一种工具，已经在地震波形数据处理和解释中获得了很多关注。大多数应用0�对应作者。邮箱地址：tariq.alkhalifah@kaust.edu.sa（T. Alkhalifah）。0在我们的领域，许多依赖于对NN进行监督训练，其中标签（答案）是可用的（Wrona等人，2018年；Araya-Polo等人，2018年；Ovcharenko等人，2019年；Di和AlRegib，2020年；Araya-Polo等人，2019年；Vinard等人，2022年）。这些答案通常对于合成数据是可用的，因为我们可以通过数值控制实验，或者它们是使用人类解释或人类手工设计的算法应用于真实数据而确定的（例如用于首到达时间拾取的算法，Molyneux和Schmitt，1999年）。在合成数据上训练我们的NN的挑战在于训练的NN能否推广到真实数据，因为这个过程需要仔细确定训练集，并在合成和真实数据之间包含真实噪声和其他变量。换句话说，合成数据和真实数据通常相去甚远0https://doi.org/10.1016/j.aiig.2022.09.002收到日期：2022年5月31日；收到修订稿日期：2022年9月24日；接受日期：2022年9月24日1020地球科学中的人工智能3（2022年）101-1140T. Alkhalifah等人0来自相同分布，这对于训练的成功至关重要（Kouw，2018年）。因此，许多经过合成训练的NN在真实数据上表现不佳。另一方面，在真实数据上训练提供的NN通常最多只能与由人类或人类设计的算法确定的标签的准确性一样好（由于标签有限或容易出错，这是弱监督，Kara-manolakis等人，2021年）。因此，在这种情况下，机器学习的数据驱动特性将受到严重损害（Zhou，2017年；Zheng等人，2021年）。因此，我们应该合成生成尽可能真实的训练NN的数据。0建模是一个通用术语，包括任何正向操作0我们拥有一个模型，并试图获得相应的数据。该过程可以简单到矩阵-向量乘法（线性），例如用于消除共同射线聚集或图像数据中潜在缺失的痕迹，或者用于插值目标，其中完整的射线聚集或图像代表模型（我们的目标）。建模还可以包括更复杂的操作，比如使用任何数值方法解决波动方程（Aki和Richards，2009年）。对于地震反演，建模在其最简单的形式下通常由源波与反射率模型的卷积给出（Wang，2016年）。建模是一个确定性过程（Tarantola，1987a），因此，输入-输出组合是唯一的，并且通常可以通过数值方法确定。因此，使用建模和模拟，我们可以以直接的方式生成带有相应标签的ML训练输入数据。通常，在这种情况下，合成生成的数据（如带有缺失痕迹的射线聚集）代表NN的输入，以使其学会输出模型（即相应的完整射线聚集）（He等人，2021年）。对于在合成数据上训练的NN能够推广到真实（应用）数据，合成训练集必须尽可能包含真实数据中嵌入的特征（Kouw，2018年）。首先，训练数据集（输入和标签）应该由包括输入和预期标签的分布表示，这将使训练过程不会收敛到真实数据的非锐利（平坦）局部最小值（Mulayoff和Michaeli，2020年）。然而，特别是关于网络的输入数据，这一要求在建模和模拟中使用的简化假设方面很难实现。这要求我们准确地再现真实数据中存在的相关和不相关噪声（�（�）），其中�在这里是时间（或任何垂直轴，如深度）。更重要的是，它还要求我们正确地表示源波和反射率，这两者在真实数据中存在。换句话说，在我们简化的地球模型中，这三个函数的分布应该覆盖真实数据的分布，这是非常难以实现的（Birnie，2018年）。这里的�代表卷积过程。因此，我们需要找到一种方法来弥合在合成数据上训练NN和在真实数据上应用它们之间的差距（见图10）。0试图弥合训练和0机器学习中的应用数据被称为领域适应（Kouw，2018年；Lemberger和Panico，2020年）。在这种情况下，假定训练数据集属于源领域，应用/推断数据假定属于目标领域，即我们的训练目标。机器学习的经典理论假设训练模型的应用（目标）数据应来自与训练（源）集相同的总体（从相同的分布中抽样）。因此，我们需要合成（源）数据集的概率分布��（��，��），其中��是输入（即合成波形数据），的标签（即到达时间拾取或地平线），以使其等于真实（目标）数据集的概率分布��（��，��），其中��是输入（即真实地震数据），��是目标集的标签，我们经常试图数据适应的一类是称为子空间映射（或更一般地称为对齐），在其中我们找到一个变换�，使得训练（源）输入数据的分布等于应用（目标）输入数据的分布（Fernando等人，2013年）。具体来说，��（�（�））=��（�）。这可以0通过将源和目标数据投影到两个子空间的特征向量，然后找到这些投影空间之间的变换来实现。这样的投影可以通过神经网络嵌入来实现（这是离散变量的低维学习连续向量表示，Koehrsen，2018年），旨在找到嵌入层的权重，以最小化源样本和目标样本之间的距离。有许多方法来约束变换或权重，使分布相似，包括使用最优传输（Villani，2008年）。在这个类别中，甚至循环生成对抗网络（GANs）也被用于学习一个生成器，将目标数据分布映射到源数据分布（Palladino等人，2020年）。然而，当数据的维度很大时，例如波形（包括地震和超声波）数据，这些方法变得更难应用。本文提出的方法在经验上分享了子空间对齐的一般框架，并且专门为波形（如地震）数据量身定制。0对于地震应用以及许多其他应用，我们0通常使用放置在被调查地球表面的传感器来获取波形数据。在成像应用中，这些数据通常松散地约束垂直（深度）轴（主要由沿记录通道的特征行为描述），因此，我们在深度上准确成像事件时面临问题。在这种情况下，井经常用于纠正深度错误，因为井被认为是地面真实标记（Luo等人，2019年）。然而，这些图像中的结构信息是由地震（波形）数据提供的。在不需要精确的垂直尺度标记（比例方面）的应用中，最近建议使用输入数据与同一数据的参考跟踪的互相关来帮助减少训练和应用数据的差异，从而最终有助于将ML应用于直接波形微震事件定位（Wang和Alkhalifah，2021年）。具体来说，互相关过程将垂直轴转换为滞后维度，使得训练和应用数据的范围变得更加接近。在此之前，Choi和Alkhalifah（2011年）使用卷积观察数据的参考跟踪与合成数据进行卷积，并反之亦然，以解决速度模型的波形优化问题。这个过程有助于减少目标函数的项之间的差异，特别是在减轻优化对源签名的依赖性方面，而这通常是未知的。在这两个发展的精神下，与参考跟踪和卷积相关的变换被提出用于帮助我们使经过合成数据训练的NN适应于真实数据。0神经网络模型的目标是为我们提供0给定输入的输出。经过训练的模型给出的输出基于其经历的训练，这主要取决于源训练集及其分布。当目标数据尽可能多地在源数据集中表示时，经过训练的神经网络能够很好地泛化。为了帮助实现这一点，当应用（目标）数据是真实（现场）数据时，我们在这里提出尽可能多地将真实数据特征注入到合成数据训练中。这可以通过利用合成数据和现场数据之间的线性操作的组合来实现，包括交叉相关、自相关和卷积。这些操作将使训练（源）合成数据集和（目标）真实数据集的分布更加接近，从而有助于训练模型更好地泛化真实数据。我们在这里使用一个真实数据泛化的示例来测试该方法，即专门用于直接从记录的波形数据中定位微震源的神经网络。我们还在一个专门用于从高频数据中预测低频数据以最终帮助全波形反演（FWI）更好收敛的神经网络上测试该方法（Ovcharenko等人，2022年）。0本文的其余部分组织如下。我们介绍我们的0经验数据投影方法，并解释为什么它能够映射1030地球科学中的人工智能3（2022年）101-1140T. Alkhalifah等人0在训练（合成）和测试（真实）数据之间传递信息。然后，我们以算法的形式详细描述了转换步骤。包括使用被动地震数据定位微震事件和使用主动地震数据预测缺失的低频的两个真实数据示例的应用。最后，我们详细讨论了该方法的优势和劣势，并进行了一些结论性的讨论。02. 经验数据投影0这里提出的方法主要适用于监督学习0ing。此外，我们假设输入剖面（图像或射线Gathers）的垂直轴对于手头的任务来说并不是绝对值上至关重要的。只有沿着该维度的事件之间的相对关系才是重要的。这种假设的原因将在后面变得清晰。02.1. 设置0我们假设我们没有应用数据的标签，因此0我们无法进行迁移学习（一种领域自适应形式）（吴等人，2020年）。在我们的情况下，源合成数据是有标签的，但目标真实数据却没有。这种领域自适应通常需要使用无监督机器学习方法（费尔南多等人，2013年）。在这种领域自适应中，还隐含了另一个重要的假设，即目标标签是从与源标签相同的分布中抽取的（�（��）=�（��））。这是将合成训练的神经网络模型应用于真实数据的重要假设。当然，这要求我们计划在现场数据上执行的任务由合成训练数据表示。具体而言，��（��|��）|��）。在物理学上，这意味着我们用于生成合成数据的建模代表了实际的物理行为。换句话说，用于建模合成训练集的假设代表了应用对象（如地球）。这个假设在包括FWI（Tarantola，1987b）在内的大多数优化应用中都有所使用。因此，我们在这里要解决的问题是输入分布的源数据和目标数据不相同的情况，具体而言是��（��）≠��（��）。0这种训练和应用数据集之间的差异形式0在机器学习术语中，分布的变化被称为协变量转移（Fernando等人，2013年）。有许多方法来衡量这种转移，包括使用Kullback-Leibler（KL）散度度量。在域自适应中，与一般机器学习定义的错误边界类似，我们可以定义对训练的网络模型应用的错误边界。这个错误边界由训练中的错误和与NN模型的复杂性（比如其大小）相关的项的组合给出。然而，这假设训练和应用数据来自相同的分布。对于协变量转移的情况，我们有一个类似的、更复杂的边界，由Ben-David等人（2007年）、Lemberger和Panico（2020年）给出：0��(��)≤��(��)+�(��(��),��(��))+�,(1)0其中��是训练误差的上界，�(.,.)是源和目标数据集的边缘分布之间的距离。这里，�代表了神经网络模型在源和目标数据集之间的最优联合误差。因此，应用误差的上界由这三个项引导。0因此，我们的目标是设计一种最小化的转换0差异度量�在等式（1）中是训练（源）和应用（目标）数据集的分布之间的差异度量。具体来说，我们的目标是找到变换��(��)在源数据集上和��(��)在目标数据集上概率分布��(��)≈��(��)。图1总结了这个目标在训练过程中的框架内。因此，神经练输入（��）模型是��，其中模型参数被优化以匹配标签��使用损失函数（�）。另，在推断期间的输入是��。我们将在下一节讨论变换��和��，在那里输入是波形（）数据�。02.2. 为训练调整合成数据0地震数据中的一个迹线可以用以下组合来表示0反射波形和噪声，如下：0��(�)=��(�)��(�)+��(�)，(2)0其中�是迹线的索引，�是迹线所属的部分的索引，无论该部分对应于射线收集还是地震图像。根据数据的不同，所有三个分量（�(�)、�(�)、�(�)）在迹线和部分上都可能变化。在这里，�可能代表时间或深度，具体取决于输入是射线收集还是深度图像。例如，对于射线收集，�(�)随着移动而改变，当然，�(�)从一个迹线变化到另一个迹线。在训练神经网络模型以正确处理d(t)时，我们通常在训练中使用合成数据��，希望它包含所有这些分量的适当表示。0为了做到这一点，我们使用在垂直轴（时间0或深度），因此，正如前面提到的，我们假设垂直轴的尺度对任务并不重要。尽管这种假设限制了这种方法的应用，但它将允许我们对域自适应应用必要的转换。我们将在讨论部分详细阐述这种假设可能对这种方法的应用产生的影响。为了将等式（2）中描述的分量从真实数据迁移到合成数据，我们使用线性操作，因此，我们定义新的训练数据（由所提出的方法转换的源数据）如下：0其中，��(�)=��(�)��(�)��(�)��(�)，(3)0其中�是来自合成输入数据的参考迹线的索引（对于合成和真实数据都是固定的），�是来自真实数据的部分的索引，无论该部分对应于射线收集还是地震图像。运算符�表示交叉相关，在这个方程中，我们有输入合成部分��(�)和该部分的参考迹线��(�)的交叉相关0每个训练周期从真实数据��（�）中随机选择（�）自相关截面。因此，合成数据将暴露于场地数据的分布。参考道可以是射线接收器道中的近偏移道，也可以是地震图像输入的任何道。参考道的索引在各截面之间不应改变，以保持截面之间的相对关系。自相关真实数据的随机选择的�索引在训练中每个周期变化，以确保真实数据在训练集中得到适当的表示。假设真实数据中只有噪声，随机噪声的自相关将在零滞后处产生与噪声能量成比例的准δ函数。与这样的函数的卷积将把该能量合并到合成数据中，使得转换后的合成数据的信噪比（SNR）与自相关真实数据的相当。0为了让转换后的源数据具有类似的分布0对于应用数据，我们还以类似的方式转换目标（应用）数据，其中合成数据的特征被纳入目标数据。为了实现这一点，在推断阶段我们对真实数据应用以下转换，�：0�� （�）=�（��）=��（�）��0� �0� � ��（�）�� （�），（4）0其中包括与方程（3）中相同的操作，只是真实和合成数据的角色颠倒了。在这种情况下，��代表训练集中的合成截面数量，实际上我们与自相关合成数据的均值进行卷积，而不是像训练中那样随机选择样本。我们将在Eqs中引用转换。（3）和（4）为{MLReal转换}。每个数据（合成和真实）在Eqs中具有两个实例的想法。（3）和（4）是为了平衡它们对新训练和应用数据的贡献1040地球科学中的人工智能3（2022）101-1140T. Alkhalifah等人0图1。所提出的数据适应工作流程，其中训练（源）数据集的分布可能与应用（目标）数据集不同，变换Ts和Tr将有助于减少这种差异，并提供新数据作为神经网络函数（NN）的输入，以训练网络减少损失L，然后应用于真实数据。这里，P是概率分布，我们展示了它们的源和目标数据集的示意版本。0图2。应用于海洋数据的MLReal方法的工作流程图。左侧：用于生成训练数据的提议过程；右侧：用于生成应用数据的提议过程。圈叉符号表示交叉相关操作，星号表示卷积操作。输入道中虚线垂直黄线表示参考道的位置。0集合。这样，我们可以匹配用于训练和推断的合成和真实数据的属性。请注意，连接合成和真实数据贡献相等量的卷积操作是可交换的。我们将在下一节中更多地看到这种操作的价值。同时，图2（左）展示了应用方程（3）的过程，其中合成数据是为了训练NN模型预测低频（Ovcharenko等人，2019年）而生成的。目标是通过将低频内容添加到数据中，改善真实海洋数据的FWI收敛。这种低频对FWI收敛的重要性在Ovcharenko等人（2022年）中得到了证明。另一方面，图2（右）展示了在真实数据上应用方程（4）的过程作为训练模型的输入。请注意，两个过程的结果看起来相似，并且它们在能量沿通道的分布方面尤其相似。然而，它们仍然保持原始数据（合成或真实）的特征（移动）。但是，它们包含更多的能量和更多的特征，NN模型可以利用。我们将在示例中展示应用该过程的结果。02.3. 频率域分析0如果我们将真实数据转换到频率（或垂直波数）域，考虑到傅里叶表示的交叉相关和卷积的基本定律，方程(2)可以写成0� �� ( � ) = � �� ( � ) � �� ( � ) = � �� ( � ) � �� ( � ) + � �� ( � ) , (5)0其中 � 是角频率， � 和 �分别是复值数据的幅度和相位。所有大写字母分别表示方程(5)中反射率、源和噪声函数的频率域形式。因此，我们可以将方程(3)写成频率域中的形式0� � � ( � ) = �� ( � ) � � � ( � ) �� ( � ) � �� ( � ) = �� ( � ) � � � ( � ) ( � �� ( � ) ) 20= �� ( � ) � � � ( � ) ( � �� ( � ) � �� ( � ) + � �� ( � ) )0× ( � � �� ( � ) � � �� ( � ) + � � �� ( � ) ) , (6)0其中上划线， �.，符号代表复共轭。在真实数据上应用模型将涉及到方程(4)给出的模型输入，可以在频率域中表示为0� � � ( � ) = �� ( � ) �0� �0� �� ( � ) � �� ( � )0= � � ( � ) � � ( � ) � � ( � � ( 0� �0� �� ( � ) � �� ( � )0= ( � � ( � ) � � ( � ) + � � ( � ) ) ( � � � ( � ) � � � ( � ) + � � � ( � ) )0× 10� �0� �� ( � ) � �� ( � ) . (7)0请注意，训练输入的频率内容和在真实数据上的应用将以均匀方式包括真实数据的平方振幅（�）。此外，关键在于方程(6)和(7)共享相似的噪声、反射率和源1050地球科学中的人工智能3（2022）101-1140T. Alkhalifah等人0图3.（a）被动地震采集线。（b）在该区域估计的速度模型，并用于生成合成数据。0签名，或更一般的说法，相似的能量。由于两个数据集在转换后共享从它们对应分布中抽样的相同元素，那么两个数据集的分布应该是接近的，这使我们能够满足对NN模型的泛化的要求 � � ( � � ( � )) ≈ � � ( � � ( � ))。换句话说，方程(1)中的第二项将很小。03. 算法0考虑到我们有未标记的真实数据，我们希望通过训练神经网络来执行特定任务，首先生成由输入特征和代表手头任务的标签组成的合成样本，其中我们假设 � � ( � � | � � )=1060地球科学中的人工智能3（2022）101-1140T. Alkhalifah等人0� � ( � � | � � ) 。接下来，我们将合成输入特征和真实数据输入暴露给所提出的转换0因此，这里建议的转换涉及的步骤0对于域自适应，可以在训练阶段使用算法1进行总结。训练后，可以使用算法2对真实数据进行应用（推理）进行总结。考虑到所涉及的转换的线性性质，所有转换步骤可以在傅里叶域中高效地执行。我们只需要在过程结束时对数据进行傅里叶逆变换。0输入：真实地震输入数据，�；输入真实数据部分的数量��；合成输入地震数据，��；务对应的合成数据标签，�；合成样本数量��；神经网络模型��；损失函数�；时代数参考相关性跟踪索引，�。0输出：训练好的模型 � � �。1: 初始化： � � with parameters � = � 0；2: 对1 … � � do 3: � � ( � ) = � � ( � ) �� ( � )，真实数据随时间的自相关；04: 结束循环5: 对于 �� = 1 …� do 6: 对于 � = 1 … � � do07: � � ( � ) = � � � ( � ) � � �� ( � )，输入合成数据与参考迹线的交叉相关， �08: � � ( � � � ) = � � ( � ) � � � ( � )，交叉相关输入与随机绘制的自相关真实数据的010: 使用损失， � ( � � ( � � ( � � ))， � )，我们更新 �011: 结束循环12: � �� = � �0算法2 单个输入的应用阶段0输入：真实地震输入数据剖面， � � ，对于 � ∈ {1 , � �}；合成输入地震数据， ��；合成样本数 � �；训练好的神经网络模型 � � �；0输出：预测， � � �。01: 初始化： � ( � ) = 0；2: 对于 � = 1 … � � do 3: � ( � ) = � ( � ) + � � � ()，合成数据的自相关的总和；04: 结束循环5: � ( � ) = 1 � � � ( �)，均值06: � � ( � ) = � � ( � ) � � �� ( � )，输入真实数据与参考迹线的交叉相关， �；07: � � ( � � ) = � � ( � ) � � ( � )，交叉相关输入与合成数据的均值的卷积；08: � � � = � � � ( � � ( � � ))，预测。04. 微震数据示例0我们将首先展示上述操作对真实数据的影响0作为监测微震事件的一部分获取。被动地震采集是使用传感器的星形配置进行的，如图3(a)所示，用于监测美国阿科玛盆地页岩气储层的水力压裂刺激。图4(a)显示了一个微震事件的真实数据。射击收集剖面包括来自各条线（方位角）的十个段，如图4(a)所示，这里并排绘制。我们提供了总共75个这些微震事件记录以及事件的相应位置，这些位置是使用常规方法确定的（我们0仅在这里使用其中的10个）。这些标签（事件位置）将帮助我们评估我们训练的NN模型的准确性。有关数据的更多细节，我们建议您参阅Staněk和Eisner（2017年）。我们还获得了该地区的速度模型，如图3(b)所示。使用这个速度模型，我们采用时间二阶和空间四阶的有限差分逼近来解决声波方程，并模拟来自感兴趣区域内5000个随机放置的地震点源的波场（我们期望真实事件的位置在该区域内）。得到的5000个合成记录的剖面，使用图3(a)中的布局，以及相应的事件位置（标签）以随机方式分成训练集（4000个样本）和验证集（1000个样本）。例如，对于与图4(a)中估计的真实数据剖面附近的事件，如图4(b)所示。如果我们将这个合成生成的剖面与现场剖面进行比较，我们可以欣赏到这两个数据之间的巨大差异，尽管它们由于来自附近源而具有相似的一般形状。我们没有源时间信息，这解释了两个剖面中事件之间的偏移。我们在这样的合成数据上训练了神经网络模型（使用交叉相关运算与参考迹线来减轻偏移（Wang和Alkhalifah，2021年），由于训练和测试数据之间特征的巨大差异，事件位置的准确性，正如我们后面将看到的那样，是低的。04.1. 数据转换0参考（所有合成和真实数据的固定位置）剖面中的第一道的互相关。在这个应用中，参考道由每个输入剖面的第一道给出，换句话说，第一行的第一道。将此操作应用于图4(a)和4(b)中显示的剖面的示例结果分别由图5(a)和图5(b)给出。此操作在很大程度上减轻了场地和合成数据之间的时间偏移，因为垂直轴现在由时间滞后给出。然后我们计算场地和合成数据的自相关，其中的一个样本显示在图6(a)和图6(b)中，分别对应于图4(a)和图4(b)中显示的剖面。我们可以欣赏到场地剖面的自相关有多大程度上携带了以零相位方式表示的源子波和噪声的信息。在合成和真实数据上应用MLReal转换中涉及的操作（Eqs.（3）和（4）），我们分别得到图7(a)和图7(b)中显示的剖面。我们对靠近零滞后的部分进行窗口处理，以减小输入到网络数据的大小。这两个剖面看起来比图4(a)和4(b)中的剖面更相似。04.2. 训练0作为标签的源位置（�，�和�）从建模中已知，我们训练了一个14层卷积神经网络来预测微地震源的位置。训练包括4000个输入剖面（样本，经过建模合成）及其相应的标签（训练集），并且训练在5000个时期内执行，单批处理，使用Adam优化器（Kingma和Ba，2014年）。在5000个时期中的每一个时期都会对来自真实数据的随机选择的自相关剖面进行卷积。随机选择可以使训练样本中提取的来自真实数据的信息的差异更大。训练和验证的损失函数分别显示在图8(a)和8(b)中，显示出良好的收敛性。由于数据是在地表记录的，我们可能会预期事件的水平位置的误差远小于垂直位置的误差。因此，预计在定位事件时横向分辨率会更高。107A projection of the reference and predicted locations onto the 2D 𝑥−𝑦,𝑥 − 𝑧, and 𝑦 − 𝑧 planes highlights the accuracy along the various axes(Fig. 10) in support of the loss curves shown in Figs. 8(a) and 8(b).The differences are generally small and can be caused by many factors.For one, the NN model is known to have a bias toward smoothing theoutput (Rahaman et al., 2019). A very small network (Wang et al.,2020) will levitate towards the mean of the training labels. Of course,a cure for that is to increase the network size. Another reason for02022年地球科学中的人工智能3（2022）101-1140T. Alkhalifah等0图4.（a）单个微地震事件沿10条线并排绘制的现场记录数据。（b）源接近现场数据的合成数据，为此事件提供。源的时间是未知的，这解释了偏移。0图5.（a）图3(a)中记录数据的互相关与该剖面中第一道的互相关。（b）图3(b)中合成数据与该剖面中第一道的互相关。0图6.（a）图6(a)中记录数据的自相关。（b）图6(b)中合成数据的自相关。04.3. 结果0然后我们将应用了Eq.（4）中的操作的10个真实数据剖面输入到训练模型中，以评估预测的准确性。图9显示了调查区域内的预测位置（蓝色）和提供的位置（红色）。我们还展示了没有与自相关进行卷积，只与参考道进行互相关的预测（Wang和Alkhalifah，2021年）。10802022年地球科学中的人工智能3（2022）101-1140T. Alkhalifah等0图7. (a)在应用等式（4）（提出的转换）后，一个示例部分测试应用数据的示例，显示在图3(a)中的部分。(b)在使用提出的方法注入真实数据信息后，对应于图3(b)中显示的部分的训练输入数据，特别是等式（3）。0图8. (a)分别为各坐标分量和总损失（距离）的训练损失。(b)验证损失。10902022年地球科学中的人工智能3（2022）101-1140T. Alkhalifah等0图9. (a)预测（蓝点）和提供（红点）的10个现场数据事件的源位置的三维图，以及没有使用其他数据自相关的卷积的训练和预测（灰点）。点之间的细线连接了来自两个预测的提供位置。0图10. 10个现场数据事件的预测（蓝点）和提供（红点）的源位置的位置，以及没有使用其他数据自相关的卷积进行训练和预测的位置（黑点），所有这些都投影到(a) �−�平面，(b) �−�平面和(c)�−�平面上。点之间的细线连接了预测和提供的位置。110masimilar to those from the synthetic data distribution. In other words,we assume that the velocities used in generating the synthetic dataare close to the true Earth ones, which will mitigate the limitationwe mentioned with regard to the vertical dimension of the input. Toset up the adaptation workflow for the input high-frequency data,we select an arbitrary trace from the high-frequency partition of thesynthetic dataset and use this trace as a constant amplitude referencethroughout the application. During training, for a given sample ofinput high-frequency data, we first cross-correlate it trace-wise witha reference trace from the same shot gather (Fig. 2). Then we drawa random high-frequency data sample from the field dataset and con-volve its auto-correlation with the result of the previous operation, asdemonstrated in Fig. 2. The effect of such transformations is shownin Fig. 12. The transformed synthetic and real data look-alike to thepoint they share similar energy distribution as a function of offset. Thesynthetic transformed data are used to train the network without theneed to apply any alterations to the output synthetic low-frequency shotgather, as the NN needs to learn such mapping. Of course, we imposethe assumption that the synthetic elastic modeling here represent thephysics of wave propagation inside the Earth.02022年地球科学中的人工智能3（2022）101-1140T. Alkhalifah等0图11. 领域数据和模型数据之间的归一化欧几里得距离（蓝色），以及使用提出的方法（实线）和使用相同网络进行训练但没有与自相关进行卷积的实际源位置（虚线）之间的标签差异。0差异可能在于我们在训练神经网络模型时使用的数据模拟简化假设，与数据提供者在确定事件位置时可能使用的建模方法。为了进一步评估使用提出的MLReal转换在训练和应用之间的数据一致性改进，我们计算了新测试（真实）部分和相应的合成部分之间的归一化欧氏距离（NED）。图11显示了仅使用参考跟踪进行交叉相关以减少偏移（虚线蓝色）的部分和使用MLReal转换进行训练的部分（实线蓝色）的NED。虽然NED值可以在0到1之间变化，但与仅与参考进行交叉相关相比，我们提出的方法的值相对较高。我们还在图11中绘制了相同10个事件的预测源和提供源之间的距离。对于我们提出的方法，这些值平均约为15米。考虑到数据的质量和表面传感器的布局，对于所提出的方法来说，这些差异是非常合理的。与之前开发的仅与参考跟踪进行交叉相关的方法（Wang和Alkhalifah，2021）相比，位置差异平均约为45米（图11，黑色）。因此，这个例子中的转换（我们的领域适应方法）帮助很多。05. 低频预测示例0在这个例子中，我们将该方法应用于低频率的任务0外推。特别是，我们从可用的高频表示中重建低频分量，<5赫兹，以获得完整的射线聚集。预测的低频数据旨在通过减轻循环跳跃问题（Ovcharenko等人，2019）帮助全波形反演（FWI）收敛到全局最小值。由于低频在现实世界的现场数据中通常不可用或受到噪音的污染，我们在合成数据上训练了一个深度神经网络，并在西北澳大利亚近海获取的带限制的海洋数据集上进行推断。图2显示了一个示例射线聚集。0类似于一个反问题，寻求的模型通常是未知的

下载后可阅读完整内容，剩余1页未读，立即下载