地球科学中的自监督网络去噪地震数据的潜力

192 浏览量更新于2023-12-06 收藏 3.13MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

地球科学中的人工智能2（2021）47自监督网络抑制地震数据中随机噪声的潜力Claire Birnie*，Matteo Ravasi，SiX iu Liu，Tariq Alkhalifah阿卜杜拉国王科技大学，沙特阿拉伯图瓦尔A R T I C L E I N F O关键词：机器学习噪声抑制自我监督学习A B S T R A C T在许多地震处理工作流程中，去噪是一个必不可少的步骤。这种噪声的一部分，特别是在陆地数据集中，表现为随机噪声。近年来，神经网络已成功地用于以监督的方式对地震数据进行去噪。然而，监督学习总是伴随着通常无法实现的要求，即具有用于训练的噪声-干净数据对使用盲点网络，我们将去噪任务重新定义为一个自我监督的过程，其中网络使用周围的噪声样本来估计中心样本的无噪声值基于噪声在样本之间统计独立的假设，网络由于其随机性而难以预测样本的噪声分量，而信号分量由于其时空相干性而被准确预测在合成示例中，盲点网络被证明是受随机噪声污染的地震数据的有效降噪器，对信号的破坏最小;因此，在图像域和下行任务（如叠后反演）中提供了改进。为了结束我们的研究，建议的方法被应用到现场数据和结果进行了比较，两种常用的随机去噪技术：FX反卷积和稀疏促进反演曲线波变换。通过证明盲点网络是随机噪声的有效抑制器，我们相信这只是在地震应用中利用自监督学习的开始。1. 介绍在地震记录中，噪声总是作为所需信号的不需要的伴随信号出现因此，噪声抑制是所有地震处理工作流程中的基本步骤（Yilmaz，2001）。由于当地场地条件以及地震源的激发，总噪声场可以看作是由不同来源产生的许多噪声分量的总和，每个噪声分量都有自己的特性（Birnie等人，2016年）。通常，噪声抑制程序识别一个定义属性，该属性可以轻松区分目标噪声和所需信号，并利用该属性将前者与后者分开。在本文中，我们考虑了噪声场的随机分量，并利用其不可预测的性质来构建抑制过程。随机噪声抑制已经被地震界广泛研究，大多数提出的技术属于以下类别之一：基于预测、基于变换和基于分解。基于预测的方法通常采用预测滤波器，其旨在利用相干信号的可预测性质，因此充当噪声抑制器。EX这样的示例方法包括T-X预测滤波和F-X去卷积，这两者都可以以固定或非固定方式应用（例如，Chase，1992年;Abma和Claerbout，1995年;Gülünay，2000年;Liu和Chen，2013年）。基于变换的方法将数据变换到一个域中，通常是稀疏的，其中信号和噪声可以很容易地区分，因为它们各自的特性。通过利用曲波域中地震数据的稀疏性质，曲波变换是常用的基于变换的去噪过程（例如，Hennenfent和Herrmann，2006年; Neela-mani等人，2008; Lianyu等人，2009年）。类似地，在文献中已经提出了使用不同变换的其他基于变换的方法，例如小波变换（Zhang和Ulrych，2003; Mousavi等人，2016），shearlet-（Merouane等人，2015）和地震波变换（Fomel和Liu，2010）等。最后，基于分解的过程将地震数据表示为加权基函数的组合，并抑制与噪声分量相关的那些。这样的分解过程利用谱分解（Fomel，2013）、经验模式分解（Bekara和Van der Baan，2009）和奇异值分解等* 通讯作者。电子邮件地址：cebirnie@gmail.com（C. Birnie）。https://doi.org/10.1016/j.aiig.2021.11.001接收日期：2021年8月31日;接收日期：2021年11月1日;接受日期：2021年11月2日2021年11月13日网上发售2666-5441/© 2021作者。出版社：Elsevier B.V.代表科爱通信有限公司公司这是CC BY许可下的开放获取文章（http://creativecommons.org/licenses/by/4.0/）中找到。可在ScienceDirect上获得目录列表地球科学中的人工智能杂志主页：www.keaipublishing.com/en/journals/artificial-intelligence-in-geosciencesC. Birnie等人地球科学中的人工智能2（2021）4748我我Fig. 1. Noise2Void去噪过程的示意图。（Bekara和Van der Baan，2007年）。随着机器学习（ML）在物理学中的应用越来越受到关注，已经提出了一类新的随机噪声抑制过程这些方法中的大多数都属于深度学习（DL）领域，并使用监督训练方法，该方法需要干净的数据进行训练，以伴随噪声输入数据。由于在DL的地震应用中普遍存在，许多研究已经考虑使用合成地震数据集来训练卷积神经网络（CNN）（例如，Si等人，2019年; Kim等人， 2019年; Wang和Chen，2019年），以及许多其他利用半合成数据集的研究，其中记录的噪声被添加到建模的波形数据中（例如， Zhang等人， 2020年; Alanova等人， 2021年）。虽然这些实验在合成数据集上显示出有希望的去噪能力，但它们通常难以推广到现场数据（Zhang et al.， 2019年）的情况。可替代地，常规去噪过程可以用于为它们的 Mandelli等人， 2019年）的情况。然而，这种方法的性能将受到经典去噪器的性能的限制，并且包括由于模型的不完善而引起的预测远离噪声-干净数据对的约束，许多去噪研究已经考虑了循环生成对抗网络（CycleGAN）的潜力，其不需要配对的训练数据（例如， Mandelli等人， 2019年）的情况。虽然这样的方法不需要数据对，但是训练仍然需要干净的和有噪声的数据样本，因此创建具有与它们的有噪声的对应部分类似的特性的干净数据样本的频率内容无监督的DL过程对训练的干净数据样本没有这样的要求最近，Zhang et al.（2019）说明了如何在有噪声的地震数据上训练编码器-解码器网络以进行随机噪声衰减，而Qiu等人（2021）详细说明了如何使用替代卷积网络架构，而无需对数据进行任何开窗。这两种方法都被证明优于FX-去卷积噪声抑制程序。考虑到更广泛的科学界，大多数DL方法对于图像的随机噪声抑制，或类图像数据，通常是受监督的，因此需要成对的噪声干净数据集用于训练（Lehtinen等人， 2018年）。这通常是一个不切实际的要求-不仅在地震学中，而且在许多其他领域，没有监测技术可以收集干净的数据集。2018年，Lehtinen et al. （2018年）提出了Noise2Noise，说明了如何在平稳信号的假设下训练神经网络（NN），以根据训练对图像进行降噪在两个噪声样本上。虽然这消除了噪声-干净对的要求，但它需要噪声-噪声对，其中信号是一致的，但噪声在每个对内是变化的-这对于许多监测应用来说是一个有问题的要求。在此基础上，Krullet al. （2019）提出了Noise2Void（N2V），它只需要一个嘈杂的图像进行训练。在噪声在样本之间统计独立的假设下，使用盲点网络来基于相邻样本预测中心样本的值。由于噪声在样本之间是独立的，因此无法预测噪声对样本值的贡献，因此只能预测信号的贡献，从而实现有效的去噪过程。虽然N2 V是一种ML方法，但它也可以被认为是一种基于预测的方法;其中，它利用了预测信号的能力和无法预测噪声的能力，从而产生去噪图像。以前应用于自然图像和显微镜数据等，在本文中，我们研究了适应的N2V工作流程，以处理地震信号和伪随机噪声的高度振荡性质。通过广泛的超参数分析，我们进一步确定了地震去噪方案的最佳超参数，同时考虑到图像域的即时改善和对诸如地震反演等后续任务所观察到的改善本文最后通过应用于现场数据集来说明N2V的潜力。2. 理论：盲点网络Noise2Void（Krull等人， 2019年）基于盲点NN的概念，其目的是基于相邻的pixel预测中心PIXEL值。对单个图像x，N2 V的块x，j进行操作通过替换来自每个块的一组非相邻像素X，j，i，1; 2;N，p来在此称为有源像素EL，具有随机选择的相邻像素pi X els，与所选网络Ωj的接收场有关，如图2所示。1.一、在图的左下角，损坏的补丁。 1，成为NN的输入，而相应的原始补丁表示目标值，在图的右下角。1.一、理论上，NN架构表示为fθ，其中θ是指可训练参数，可以是任何可以在输入值和目标值之间真实映射的。在本文中，我们遵循原始的N2V NN架构：Ronneberger et al.（2015）风格的2层UNet，如图1所示。与标准NN图像处理任务相反，这里的损失函数不是在图像中的每个像素上计算的，而是仅针对活动像素进行评估，即，那些在输入图像中损坏的C. Birnie等人地球科学中的人工智能2（2021）4749¼NsNpj11/1我θXi图二、用于训练和测试N2 V及其相应幅度谱的数据集（顶部）：（a，d）具有WGN的Hess合成数据集，（b，e）具有5-100Hz带通噪声的Hess合成数据集，以及（c，f）陆地场数据集。最小1XNsXNp jxj-f<$Ωj<$p（1）2. 频率相关性，以及3. 叠后反演PSNR其中，p1，2是指损失中使用的范数-分别为平均绝对误差（MAE）或均方误差（MSE）-Ns是数字图像PSNR计算为可用的训练样本（即，从图像中提取的块Krull等人（2019）说明了MSE如何成为N2V去噪加性WGN然而，MAE是一些-PSNR¼10·log10最大值fxg2nxntk^x-xk2！（二）是地震深度学习应用的首选。在RENDIX1中，我们提供了一个数学公式，解释了在哪些情况下应该分别使用MSE和MAE。最后，我们还强调，在相关噪声的情况下，不能提供理论保证。因此，我们决定在以下数值示例中使用两种损失函数进行实验其中，x表示t是干净数据，x是调制数据（噪声或去噪），nt和nx分别表示时间样本和接收器的数量为了量化N2V去噪的效果，我们计算了噪声和去噪图像之间PSNR的百分比变化。这可以写成，一旦经过训练，该模型将直接应用于完整的地震数据。请注意，在这个阶段，由于CNN能够处理动态变化的输入大小，因此不需要对地震数据进行开窗怎么--%PSNR100峰值信噪比噪声·PSNRN2V（三）然而，在数据维度与UNet的下采样/上采样不兼容的情况下，则输入数据被零填充以实现可接受的输入数据大小。2.1. 性能度量其中，PSNR噪声和PSNRn2v是根据噪声和去噪图像。使用样本皮尔逊相关系数rxy对频率变化进行量化，目的是将噪声数据的幅度谱返回到干净数据的幅度谱这被计算为：r XY¼ Pnf Xi-Xnf Yi-Y;i ¼0i ¼0理论上，N2V可以应用于任何加工阶段，在地震数据中观察到随机噪声的情况下，本文我们qPnfXX2qPnfY2;（四）重点研究时间偏移后的地震图像许多去噪程序面临的一个共同挑战是，作为噪声抑制过程的一部分，不仅噪声被抑制，而且信号也被严重损坏;这可能对后续任务产生负面影响考虑到这一点，我们考虑了三个性能指标1.图像峰值信噪比（PSNR），其中X和Y分别是在空间轴上平均的干净数据和去噪数据的幅度谱，X和Y分别是X和Y的样本均值，并且nf是谱中的样本数与图像PSNR类似，为了分析N2V的影响，我们计算样本Pearson相关系数的百分比变化，当使用噪声与去噪数据进行计算.θ1/41/4C. Birnie等人地球科学中的人工智能2（2021）4750¼2.2*dt图三. 应用极性反转和旋转（β）的数据增强技术来增加训练数据的大小。%r<$100·r（五）表1rcl;nCl;N2V本文给出了三个算例的N2V方法的超参数其中，rcl，n是干净数据和噪声数据之间的相关系数，rcl，N2V是干净数据和去噪数据之间的相关系数为EX p.2：BP Noise选择的那些是从超参数扫描中选择的，而为EX p.3：LandData选择的那些是从EX p.2：BP Noise的那些手动调谐初始化的作为比较的最终指标，使用去噪数据作为输入EXp.1：EX第2页：EX第3页：对于标准的下行任务，即叠后反演（VeekenWGN BP噪声土地数据和Silva，2004年）。通过这样做，我们可以检查去噪的效果，可能会对我们估计声阻抗的能力造成信号损害列车运行时间4500–5001504500–500254500–50015地下模型叠后反演假设，批量12864128叠后地震数据可以由简单的卷积表示贴片尺寸64× 64 32×32 32 × 32模型如下：%活动像素0.2 25 33（6）第1次会议，但未收到会议通知;邻里半径5 15 15损失MSE MAE MAEUNet深度2 2玉米粒大小3× 3 3×3 3 × 3其中AI（t）是时域中的声阻抗分布，w（t）是时域地震子波。我们将叠后数据中整个道集的表达式重写为紧凑矩阵X-向量表示法d WDm，其中d和m是矢量化地震数据和声阻抗模型的自然对数，W是卷积算子，D是一阶导数算子。然后使用PyLops计算框架通过L2正则化反演来估计模型向量（Ravasi和Vasconcelos，2020）。反演模型的PSNR值如等式（4）中那样计算，其中X是真实模型，并且X1是反演模型。与上述两个PSNR度量一样，对于反演PSNR，我们计算噪声反演和去噪反演之间最后，对于现场数据集，没有“干净”的在这种情况下，我们进行定性比较的原始和去噪图像，频率内容，和反演产品。除此之外，我们还将N2V方法与两种常用的随机噪声抑制技术进行了和Curvelet变换的稀疏促进反演FX-去卷积（Canales等人， 1984）基于这样的概念，即地震道的相干部分可以通过空间预测滤波器从先前的道在FX域中预测。我们的结果基于FX反卷积的马达加斯加实现（Gulunay，1986），其中Liu和Li（2018）对此数据集使用了相同的参数，即20道的窗口，滤波器长度为4道。相反，第二种方法基于地震数据在Curvelet域中具有稀疏表示的原理（Neelamani等人， 2008），而随机噪声在Curvelet域上不相干地映射。我们采用稀疏促进反演与快速迭代收缩保持算法（FISTA）求解器（Beck和Teboulle，2009）和软阈值来衰减我们的地震数据中的随机噪声。3. 数据为了能够对我们的去噪过程进行定量分析，本研究的大部分内容是在合成生成的数据上进行的。利用SEG Hess VTI模型和30 Hz Ricker小波，创建30个2D切片，以模拟可从3D勘测获得的多条直线或交叉线。使用此基础波形数据创建两个不同的合成数据集：一个具有白高斯噪声（WGN），如图所示。 2（a，d）和一个5 -100 Hz带通噪声，如图所示。 2（b，e）.最后，本文将N2V去噪程序应用于中国土地征用中严重受随机噪声污染的现场数据集Liu和Chen（2013）以及Liu和Li（2018）之前分析过，在马达加斯加框架下发布了一条来自叠加后体积的二维线，作为可重复研究的持续努力的一部分图图2（c，f）示出了地震图像及其各自的振幅谱。数据集（合成和现场）的采样率为2ms。3.1. 数据准备在N2V过程之后，从地震测线中随机提取块以形成训练数据集。为了进一步增加这样的数据集的大小，采用旋转和极性反转的常见数据增强技术。这导致数据C. Birnie等人地球科学中的人工智能2（2021）4751见图4。在具有加性WGN的Hess VTI模型上进行N2V训练的训练（红色）和验证（黑色）损失的进展。增加8倍，如图3所示。训练补丁的数量和大小在本文中的示例之间有所不同，详见表1。4. 数值算例4.1. 合成WGN最初的例子描绘了一个门外汉的N2V应用到利用相同噪声特性的地震数据（即，WGN）和超参数，如对自然图像的原始N2V研究（Krull等人，2019年），并在表1中显示。图图4示出了在4500个训练块和500个验证块中的所有活动像素的训练时段期间损失的进展（等式（1））。值得注意的是，N2 V过程中的损失与监督学习中的经典损失略有不同-因为它不测量预测和地面事实之间的不匹配。在N2V应用中，零的损失是不期望的，因为这指示网络已经学会再现信号和噪声两者我们可以从损失中观察到，验证损失低于前20个epoch的训练损失虽然这一现象在原始论文中没有讨论，但我们认为这可能是由于多种因素的组合，例如：（i）数据泄漏，因为随机补丁选择过程允许训练集和验证集中的补丁之间部分重叠;（ii）需要强正则化以避免过度拟合噪声。训练模型对来自合成数据集的2D线的应用如图所示。五、训练在Nvidia Quadro RTX 4000上花费了12.5分钟，而在由453个时间样本的198个迹线组成的2D线上的应用花费了38 ms。在图像域中，PSNR增加了73%，而在频域中，无噪声波场（黑色）和去噪数据（绿色）的频谱之间的相似性要高得多，而不是噪声数据（红色）。当对数据进行反演时，很明显，对去噪数据的反演产生的声阻抗模型比噪声数据更接近真实模型，伪影明显更少。总的来说，对于被WGN污染的地震数据，表明N2V可以图五、训练的N2V模型应用于WGN合成数据集。（a）无噪声合成，（b）作为模型输入的噪声合成，以及（c）N2V去噪过程的结果(d)以及（e）分别描绘噪声数据集和去噪数据集之间以及无噪声数据集和去噪数据集之间的差异。而（g）、（h）和（i）分别是干净、有噪声和去噪数据的L2正则化反演的结果C. Birnie等人地球科学中的人工智能2（2021）4752--表2在超参数扫描期间考虑的超参数旨在识别用于5-100 Hz带通噪声去噪的最佳组合参数值选项纪元[5，10，25，50，75，100，150]批量[32，64，128]贴片尺寸[32×32，64 × 64]在声阻抗域中（底行）适度增加。最后，批量大小被证明有一个有限的一致性，其他超参数。最佳超参数组合是所有三个评分标准中每个组合的排名之和。如表1的中间列中所详述的最佳超参数组合用于训练具有图1的带通N2V模型。图7示出了训练期间的损失函数进展。%活动像素[第二、十、二十五、三十三条]图图8示出了应用于合成切片的训练网络的结果邻域半径[5，15，30]损失[MSE，MAE]火车-UNet深度2核心大小3 ×3精确地学习从周围的样本中再现地震信号，而不重新产生噪声。这显著提高了当前任务（图像域）和后续任务（如反演）的数据质量4.2. 带通噪声第二个例子侧重于提供一个更现实的例子，使用带通滤波噪声来识别地震应用中N2V的潜力。在本例中，我们执行了超参数扫描，以确定用于带通滤波随机噪声去噪的最佳超参数。根据表2中详述的值，考虑了超过860种参数组合。由于训练的计算成本，每个超参数组合仅生成一个模型。然而，还生成了100个额外的合成数据集来分析每个模型的性能。图图6示出了固定窗口大小（32乘32）和固定损失函数（MAE）的超参数子集的性能。如上所述，在图像和声阻抗域中的PSNR增益以及与无噪声数据的幅度谱的相关性的增加上评估模型考虑图 6、实验的总体趋势表明，随着训练的进行，即时期的数量增加，图像域中的PSNR增益（顶行）略微降低，而PSNR增益被带通滤波噪声污染与WGN结果类似，在图像域中观察到PSNR增加，同时与无噪声数据的幅度谱的相似性增加。然而，与WGN结果相比，在中心盐体周围观察到更大量的信号泄漏，以及在去噪结果中保留的一些噪声残留尽管如此，对去噪图像的反演导致比来自噪声图像的模型更清晰的地下模型见图7。在Hess VTI模型上进行N2 V训练的训练（红色）和验证（黑色）损失的进展，具有附加的5-100 Hz带通滤波噪声。图第六章针对具有5-100Hz带通噪声的合成数据的N2V超参数选择的网格搜索结果的子集，补丁大小为32x32，以及MAE损失函数。顶行示出了图像PSNR的%变化，中间行示出了与无噪声数据的频率相关性的%变化，并且底行示出了反演声阻抗模型的PSNR的%变化。颜色表示每个补丁的不同活动像素数，而标记形状表示训练批次大小。C. Birnie等人地球科学中的人工智能2（2021）4753图八、训练的N2 V模型应用于具有5-100 Hz带通噪声的合成数据集。（a）无噪声合成，（b）作为模型输入给出的噪声合成，以及（c）N2V去噪过程的结果（d）和（e）分别描绘噪声数据集和去噪数据集之间以及无噪声数据集和去噪数据集之间的差异而（g）、（h）和（i）分别是干净、有噪声和去噪数据的L2正则化反演的结果。4.3. 现场数据应用最后，N2V工作流程应用于已知被随机噪声污染的土地数据集使用500个面片进行训练后，该模型将应用于完整的2D线。得到的去噪图像如图所示。9，并将其与常规FX-去卷积和Curvelet去噪程序的结果进行比较。图10提供了跨越模型深度范围的三个感兴趣区域的放大比较考虑到原始数据集和去噪数据集之间的差异（图9的底行），Curvelet方法已经去除了大部分噪声，但是我们认为它可能过度平滑数据（有效地降低了分辨率）以及引入了一些线性伪影（在图9的顶行中特别明显）。10）。这可能是由于以下事实：由于Curvelet变换将图像解释为局部定向波包的叠加，因此去噪过程在试图抑制噪声的同时可能稍微破坏了不同波包的相对权重另一方面，虽然FX方法也比N2V方法去除了更多的能量，但所得到的去噪图像仍然受到噪声的严重污染，这在图1的特写中特别明显。 10. 除此之外，所有方法都导致一定量的信号泄漏，尽管不同方法的性质不同支持什么是观察到的图像域，图。图11示出了不同去噪数据集之间的幅度谱的差异。FX-去卷积和Curvelet域结果都使用Curvelet方法降低了所有带宽上的能量在60和100 Hz之间优于FX方法 N2V结果显示，预期信号周围的带宽减少较少，在85 Hz以上观察到能量减少。然而，即使在信号可能不存在的较高频率下，N2V方法也不会将幅度谱降低到其他两个过程的水平最后图图12示出了原始数据的反演产物和去噪结果。与图像域中的观察结果类似，N2V结果似乎比过度平滑的Curvelet结果具有更多细节。相反，FX数据中真实信号的部分衰减导致反演声阻抗模型中特征之间的对比度较低5. 讨论盲点网络为深度学习去噪过程需要噪声-干净训练图像对的困境提供了解决方案。以前在自然图像之类的应用中使用（Krull等人， 2019）、计算机断层扫描（CT）图像（Liang等人， 2021）和合成孔径雷达（SAR）图像（Molini等人， 2021），我们已经证明，在适当的情况下，N2V也可以成为地震数据的强大降噪器。N2V依赖于这样的假设，即噪声在像素之间是统计独立的，或者如在地震情况下，在每个时空样本之间是统计独立的。在实际应用中，地震资料中的噪声往往具有一定的相关性。尽管如此，我们已经证明，在WGN上提供最佳结果的同时，N2V仍然可以有效地消除合成带通滤波噪声和记录噪声C. Birnie等人地球科学中的人工智能2（2021）4754见图9。不同随机噪声抑制方法的比较。顶行显示了原始数据（左），然后是FX-，curvelet-和N2 V-去噪程序的结果，从左到右。最下面一行说明了去噪结果与原始数据之间的差异从外地收购。据观察，对于地震去噪，与最初的N2V应用相比，历元的数量必须大大减少，而活动像素的数量必须增加。历元的减少阻碍了网络学习复制轻度相关的噪声，同时仍然提供足够的训练时间来学习数据中的主导信号。然而，增加活动像素的数量通过向训练数据集中引入额外的腐败来充当训练过程的正则化器通常在地震应用中，去噪在解释之前执行，或者作为诸如反演的下线任务的准备。在本文中，我们采取了一种后座方法，并选择了一个超参数选择，这是三个性能指标之间的妥协。这导致实际合成示例（具有带通滤波噪声的HessVTI模型）的图像域中的PSNR增益为39.28%，反演域中的PSNR增益为1.32%然而，如果仅对数据进行去噪以进行直接解释，我们可以选择最佳的超参数来执行此任务，这将导致图像域PSNR增益为50.24%。对于反演也可以说类似的情况，其中对于最佳超参数组合，反演PSNR增益将为6.27%（如图2所示）。（六）。通常，DL过程伴随着漫长的训练时间，通常使得方法在计算上比常规过程明显更昂贵（Birnie等人， 2021年）。然而，由于所需的时期数量很少，N2 V方法可以在几分钟内训练并随后应用于现场数据-我们的现场数据实验训练为7分钟在叠后体积可用的情况下，通过从NN中的2D卷积层到3D卷积层的适配，可以扩展到3D去噪。卷积块这可能会以增加网络的计算成本和内存需求为代价进一步改进去噪过程使用叠后地震数据说明了N2V的潜力，然而，对盲点网络可以应用于去噪的处理阶段没有限制由于已知受随机噪声污染的现场数据集的可用性，并且已被其他人广泛研究作为随机噪声抑制程序的基准数据集（例如，Liu和Chen，2013;Liu和Li，2018）。然而，在理论上，该技术同样可以应用于炮集、接收器集、甚至被动地震数据，假设这些数据中的每一个都被随机噪声污染。N2V的一个已知限制是假设样本之间存在统计独立 Broaddus等人（2020）提出了对N2V工作流程的扩展，以适应结构化噪声抑制的方法。结构化N2V利用选择性掩蔽来最小化相关噪声对活动像素值的预测的任何贡献。这种扩展表明了利用自监督网络抑制地震数据中相关噪声信号的潜力。最简单的自适应将是针对噪声在数据的一维上是独立的情况。例如，共炮点道集上的单个噪声道，可能来自接收器耦合不良，或共接收器道集中的混合同时炮点。图13示意性地示出了针对不良耦合接收器的场景的N2V工作流的适配。与仅活动像素el被破坏的N2V不同，在StructN2V的场景中，完整的掩码（在这种情况下是迹线）被破坏，以确保活动像素el之间不能导出关系。C. Birnie等人地球科学中的人工智能2（2021）4755见图10。图中突出显示的区域的不同随机噪声抑制程序的特写比较。第九章见图11。不同随机噪声抑制方法对数据振幅谱影响的比较。pi X el和被相同噪声源污染的相邻pi x el，如图中的蓝色矩形所示。 13岁与N2V类似，在去噪过程中不需要损坏或额外的处理步骤，假设网络已经得到了令人满意的训练。虽然没有使用StructN2V的掩蔽和损失计算方法，但Wang et al. （2021）举例说明了如何在训练之前在公共接收器道集中调零炮点，U-Net可用于通过自监督方法成功地对海洋地震数据进行去混。最后，在N2V的最初出版物中，作者承认：“直觉上在培训期间获得更多信息。换句话说，N2V可能会被训练有素的监督去噪网络所超越。然而，如上所述，创建具有训练传统监督过程所需的噪声-干净对的地震数据集并不是微不足道的。当使用先前的去噪技术（诸如通过曲波变换）生成噪声-干净对时，DL的包含只能用于加速原始去噪过程。当网络从提供的训练样本中学习时，它不能优于用于生成训练数据的去噪技术。可替代地，当生成合成数据以充当合成数据时，C. Birnie等人地球科学中的人工智能2（2021）4756见图12。当去噪数据集被馈送到L2反演中时，不同随机噪声抑制过程的效果比较。图十三. 利用Structured Noise2Void进行训练和推理的工作流程示意图，用于抑制沿轨迹的相干噪声。绿色方框X表示计算损失的活动像素el，而蓝色方框X表示作为掩蔽过程的一部分要被破坏的区域。C. Birnie等人地球科学中的人工智能2（2021）4757¼-θ电子邮件我我NsXi在训练数据集上，干净的图像将绝对不包含任何噪声残留。然而，生成准确表示现场数据的合成数据是众所周知的挑战（Birnie等人，2020年）。因此，虽然可以采取某些步骤来减少DL应用的合成场数据间隙（Alkhalifah等人， 2021年），不能保证经过综合训练的网络在应用于现场数据时同样有效。最近，Laine et al. （2019）提出了第一个盲点网络程序，该程序被证明与被独立和同分布的加性高斯噪声污染的自然图像的监督去噪方法相当，有时甚至优于监督去噪方法。未来的研究将考虑不同架构和训练过程的自监督网络可以优于在合成地震数据上训练的监督网络的情况，反之亦然。6. 结论我们已经展示了如何将盲点网络应用于准确预测地震信号而不复制噪声，并因此提供了强大的随机噪声抑制过程。作为一个自学习程序，不需要额外的数据进行训练，大多数深度学习去噪程序的常见障碍通常需要一个“干净”的训练数据集。Noise2Void方法已成功应用于两个合成和一个字段数据集。虽然最初是针对随机、加性、白噪声开发的，但我们的数值结果表明，只要减少训练迭代次数，同时增加损坏像素的数量，就可以成功地训练这种网络，以去除部分相关的噪声。竞合利益作者声明，他们没有已知的竞争性经济利益或个人关系，可能会影响本文报告的工作。确认作者感谢A。Krull，T. O. Buchholz和F. Jug开源了Noise2Void的TensorFlow实现。对于计算机时间，这项研究使用了沙特阿拉伯Thuwal的阿卜杜拉国王科技大学（KAUST）超级计算实验室附录：A. 盲点网络在本文中，我们提供了这项工作中使用的盲点网络的统计解释，其推导类似于Laineet al.（2019）和Batson and Royer（2019）。首先，我们回顾一下最大似然估计（MLE），它通常被用作推导监督学习训练策略的起点：（ 7）其中X和y分别是输入数据和目标数据的分布这样的分布通常是未知的，但是一组（xi，yi）i 1，2 N s样本是可用的，这可以为我们提供边际分布。假设这些样本独立于基础分布，MLE可以表示为：^θ^argmaxQpyijxi;θ1/4argmaxPloggpyijxi;θ（八）最大值Ex;y~X;Y½logpyjx;θ];其中，可训练参数θ通过最大化在所有可用的输入和目标对上评估的对数似然的平均值来获得在去噪的上下文中，有噪图像y被表示为被具有可能已知的统计特性的一些噪声n破坏的干净图像x，即，y¼xn.然而，正如正文中所讨论的，干净图像的可用性并不总是可能的：因此，盲点网络假设未知的干净值取决于表示为Ωx的相邻（噪声）像素的上下文。此外，当噪声可以被假定为不相关时，从piX el到piX el，在假设网络将仅能够再现其相干部分而不能再现噪声分量（即y∈fθ（Ωx））的情况下，将噪声图像用作目标在数学术语中，MLE可以重写为：^θ^argmaxEx~X ½logpxjΩx;θ]最小值¼arg— 1XlogpxjΩ;θ;我（九）其中为了简单起见，我们在这里考虑第i个训练补丁。对所有可用的补丁求和得到等式（1）中的损失函数。现在让我们考虑地震数据中噪声场n的两个最常用的统计分布，并确定相应的MLE估计量：● 高斯白噪声：n~N <$0; σ 2 <$0。相应的噪声图像分布为x <$fθ<$Ωx <$-n ~N <$fθ<$Ωx <$;σ2<$。假设概率密度功能：p xjΩ; θ1-1x-fθΩx2（10）π2σ2θθθθ我θC. Birnie等人地球科学中的人工智能2（2021）4758我我X2σσ其相应的训练损失函数变为公知的均方误差（即，式（1）中的p1/2）：-XlogpxijΩx;θpxi-fθΩx2（11）我我● 拉普拉斯噪声：n~L<$0; σ<$0。相应的噪声图像分布为sx<$f θ <$Ωx <$ -n~L<$fθ <$Ω x<$; σ<$。给定概率密度函数：pxjΩ;θ1e-jx-fθΩxj（十二）其相应的训练损失函数变为公知的平均绝对误差（即，式（1）中的p1/2）：-XlogpxijΩxi;θpxi-fθΩxij（13）我我最后，图3给出了加性噪声统计模型与训练损失函数选择之间对应关系的数值验证。 14个。MSE和MAE分别在高斯和拉普拉斯噪声的PSNR方面提供最佳的去噪性能图14个。3种不同噪声模型的合成数据集的去噪：左）白高斯噪声，中心）拉普拉斯噪声，右）带通高斯噪声。顶部）噪声数据，中间）使用MAE作为训练损失的去噪数据，底部）使用MSE作为训练损失的去噪数据最后，由于地震数据中的噪声通常在时间、空间或两者上相关，我们观察到上述定义的模型都不正确。另一方面，如果我们假设噪声在时间和/或空间上具有一定的相关长度，则我们可以将相关窗口内的噪声表示为n~N 0;其中是噪声的协方差矩阵为了考虑这种相关性，我们必须写为x<$fθ<$Ωx <$- n~其中我们将附近的相关像素分组以形成向量x和n。相应的概率密度函数变为：pxjΩ;θ1K=2e-1x-fθΩx-1x-fθΩx;（14）Xð2πÞ2det1=2C. Birnie等人地球科学中的人工智能2（2021）4759训练损失可以写为：C. Birnie等人地球科学中的人工智能2（2021）4760我我我-XlogpxijΩx;θpxi-fθΩx-1xi-fθΩx;（15）我我我们观察到，如果协方差矩阵X是未知的，MAE或MSE都不能正确地估计这个损失函数。在这种情况下，图中的经验证据。14支持我们选择在轻度相关噪声的情况下使用MAE，尽管将在地震数据去噪的背景下研究考虑噪声相关性的更复杂的去噪模型。引用Abma河，Claerbout，J.，1995.用t x和f x技术进行噪声衰减的横向预测。Geophysics 60，1887- 1896.Alkhalifah，T.，王，H.，Ovcharenko，O.，2021. Mlreal：弥合机器学习中合成数据训练和真实数据应用之间的差距。在：82ndEAGE年度会议&E X.欧洲地球科学家&工程师协会，pp。 1比5。Batson，J.，罗耶湖，2019. Noise2self：通过自我监督进行盲去噪。上一篇：机器学习国际会议PMLR，pp. 524- 533.Beck，A.，Teboulle，M.，2009.线性反问题的一种快速迭代收缩阈值算法。SIAM J.我的天Sci. 2，183- 202.Bekara，M.，Van der Baan，M.，2007.地震数据信号增强的局部奇异值分解。地球物理72，V59- V65。Bekara，M.，Van der Baan，M.，2009年用经验模式分解法衰减随机和相干噪声。地球物理74，V89- V98。伯尼角，钱伯斯，K.，Angus，D.，Stork，A.，2016年。蓄水库碳储存地点记录的注入前地面地震阵列噪声的分析和模型地球物理学家。J.Int.206 （2），1246-1260.https://doi.org/10.1093/gji/ggw203网站。伯尼角，钱伯斯，K.，Angus，D.，Stork，A.L.，2020.在现实噪声条件下基准算法的重要性。地球物理学家。J. Int. 221，504- 520.伯尼角，Jarraya，H.，Hansteen，F.，2021.深度神经网络的分布式训练介绍，用于大型地震数据集的分割任务arXiv预印本arXiv：2102.13003。布罗德斯角，Krull，A.，Weigert，M.，施密特，Myers，G.，2020.用自监督盲点网络消除结构化噪声。2020年IEEE第17届国际生物医学成像研讨会（ISBI）。IEEE，第 159- 163.科诺瓦岛，Poche，S.，Kainkaryam，S.，Valenciano，A.，夏尔马，A.，2021.使用深度神经网络消除地震膨胀噪声的创新策略。第一届应用地球科学能源国际会议&。地球物理勘探学会，页。 3179- 3183。Canales，L.L.，例如，一九八四年随机降噪。1984年，任中共中央政治局委员。勘探地球物理学家协会。蔡斯，M.K.，一九九二年通过f X y预测滤波减少随机噪声。EX plor. 地球物理学家。23，51Fomel，S.，2013.利用正则化非平稳自回归将地震数据分解为谱分量。地球物理78，O 69-O76。Fomel，S.，Liu，Y.，2010. Seislet变换与Seislet框架。地球物理75，V25-

下载后可阅读完整内容，剩余1页未读，立即下载