裂缝性油藏数据驱动模型证伪与不确定性量化

126 浏览量更新于2024-01-22 收藏 2.29MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

工程18（2022）116研究非常规和智能油气工程-文章裂缝性油藏数据驱动模型证伪与不确定性量化方俊玲a，b，龚斌a，b，杰夫·卡尔斯c，李a中国地质大学地球资源学院，湖北武汉430074b构造与油气资源教育部重点实验室，武汉430074c美国斯坦福94305斯坦福大学地质科学系阿提奇莱因福奥文章历史记录：2021年10月27日收到2022年2月21日修订2022年4月24日接受2022年6月11日在线提供保留字：贝叶斯证据学习证伪裂缝性储层随机森林近似贝叶斯计算A B S T R A C T天然裂缝的许多性质是不确定的，如裂缝的空间分布、岩石物理性质和流体流动特性。贝叶斯定理提供了一个框架来量化地质建模和流动模拟中的不确定性贝叶斯方法在裂缝性油藏中的应用大多局限于综合情况。然而，在现场应用中，一个主要问题是贝叶斯先验是伪造的，因为它不能预测过去的油藏生产数据。在本文中，我们将展示如何使用全局敏感性分析（GSA）来识别先验被证伪的原因。然后，我们采用近似贝叶斯计算（ABC）方法结合基于树的代理模型，以匹配的生产历史。本文将这两种方法应用于复杂裂缝性油气藏，综合考虑了岩石物理性质、岩石物理性质、流体性质、离散裂缝参数以及压力和导水率动态等所有不确定性。我们成功地找出了伪造的几个原因。结果表明，我们提出的方法是有效的量化不确定性的建模和流动模拟的裂缝性油藏。降低了裂缝开度和断层导流能力等关键参数的不确定性©2022 The Bottoms.Elsevier LTD代表中国工程院出版，高等教育出版社有限公司。这是一篇CC BY-NC-ND许可下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）中找到。1. 介绍天然裂缝性储层构成了世界剩余石油和天然气储量的重要部分尽管裂缝的存在增强了流体储存和流动能力[3，4]，但它也给油田开发带来了重大挑战[1]。在储层建模和模拟中，许多裂缝性质是不确定的，例如离散裂缝网络（DFN）参数[5，6]、渗透率各向异性[2]、相对渗透率和润湿性[7，8]以及裂缝渗透率对储层压力的依赖性[9，10]。因此，不确定性量化在降低裂缝性油气藏开发决策风险方面起着至关重要的作用从不同来源获得的信息，例如三维（3D）地震勘测[11-*通讯作者。电子邮件地址：jcaers@stanford.edu（J. Caers）。储层预测的不确定性量化通常通过生成受生产历史[20，21]约束的多个模型来执行-即，后验实现。贝叶斯定理是一个常用的框架，以生成（后验）模型[22]，基于规定的先验和似然模型。当用于断裂属性时，先验模型可以将Monte Carlo模拟生成的重要地质特征[23，24]强加到模型上在蒙特卡罗方法中，不确定变量是随机抽样的。马尔可夫链蒙特卡罗（McMC）方法被引入到我们想要采样的分布中。最近，McMC方法越来越多地用于历史匹配和不确定性量化[21，25]。McMC生成一个相关的模型链，使估计和采样后验分布成为可能在马尔可夫链的每次迭代中，使用接受规则来决定是接受建议的模型还是保留旧模型。已经开发了几种改进的McMC方法来增强McMC方法的性能;示例包括混合McMC[26]、模式跳跃McMC[27]和并行交互McMC[28]，其处理实际应用中出现的低接受度、多模后验和高维问题https://doi.org/10.1016/j.eng.2022.04.0152095-8099/©2022 THE COMEORS.由爱思唯尔有限公司代表中国工程院和高等教育出版社有限公司出版。这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可从ScienceDirect获取目录列表工程杂志首页：www.elsevier.com/locate/engJ. Fang，B.龚和J·凯斯工程18（2022）116117McMC方法的效率是有限的，因为实现是顺序生成的。集合卡尔曼滤波（EnKF ）[29-31]、集合平滑器（ES ）[32，33]、迭代EnKF [34]和集合平滑器与多数据同化（ES-MDA）[35]等集合方法最近在量化不确定性和历史匹配方面EnKF是一种蒙特卡洛方法，它实现了用于数据同化的基于协方差的贝叶斯更新方案[31]。在线性系统动力学和模型参数服从多元高斯分布的基本假设下，通过观测数据同化，联合更新先验模型ES方法用于避免在参数更新时重新运行仿真，而迭代EnKF扩展了EnKF的假设，使其适用于数据与模型参数之间的关系高度非线性的情况ES-MDA通过引入膨胀的误差协方差矩阵改进了ES方法。最近，直接预测[24，36，37]和数据空间反演[38，39]已被引入来评估未来储层性能预测的不确定性，而无需生成后验储层模型。相反，直接预测在（历史）数据和目标（未来预测）之间建立统计模型。后验预测分布直接从观测值估计。数据空间反演将生产数据视为随机变量。后验数据变量分布通过数据空间随机化最大似然方法进行采样。然而，这些方法不能解决先验分布被伪造的情况[40]。证伪仅仅意味着所述模型永远无法预测历史数据，无论生成多少实现。贝叶斯证据学习（BEL）[41]提供了一种包括证伪的不确定性量化协议。它越来越多地用于量化石油和天然气[24]、地下水[42]和地热[23]应用中的不确定性。BEL不是一种方法，而是一种如何应用现有方法解决现场问题的协议。BEL的优点在于它可以处理任意分布的先验和任意灵敏度分析方法，这使得它在实际中适用于量化复杂问题的不确定性许多不确定性量化过程是耗时的，因为它们通常需要从地质建模和正演模拟生成数千到数万在裂缝性储层中，为了使用显式非结构化网格或精细结构化网格来捕获裂缝中的详细流体流动，必须考虑显著的计算这一挑战使得建立替代模型（也称为代理模型）作为实际裂缝性储层的计算成本较低的替代方案变得已经开发了许多用于历史匹配和不确定性量化的替代模型，例如多项式模型、克里金模型、具有空间填充设计的样条替代模型以及更广泛使用的响应面替代模型[43最近，使用基于树的回归，如随机森林模型[46]和随机梯度提升[47]，用于敏感性分析和历史匹配已经获得了越来越多的关注。许多关于不确定性量化的研究和方法使用合成案例（例如，参考文献[39]），其中先验不确定度是人工设计的，观测数据是从模拟结果中选择的。这种简化绕过了证伪问题，因为从模拟中选择的“真理”总是在先验数据的总体中，这表明先验中的观察概率足够突出。在实际情况中，先验模型的不确定性（通过仔细的地质、地球物理和工程分析确定）通常无法预测实际观测结果，这意味着先验模型是伪造的[40]。先验模型可能由于各种原因而被证伪参数的不确定性可能太窄或被认为是不确定的，所使用的物理模型可能不正确，或两者的任何组合都可能发生[23，48]。伪造问题经常在基于先前的技术中被报告[24，49]。然而，需要一种系统的方法，即去证伪，来诊断先前的问题，并将其调整为非证伪。本文的第一个主要贡献我们结合全局敏感性分析（GSA），降维，蒙特卡罗技术来确定问题。第二个贡献是，我们采用了近似贝叶斯计算（ABC）方法结合随机森林为基础的替代模型训练的非伪造之前匹配的生产历史。最后，我们将该方法应用于一个复杂的裂缝性油藏，其中所有的不确定性，包括岩石物理性质，岩石物理，流体性质，和裂缝性质的联合考虑。现场案例是位于中国渤海盆地的一个天然裂缝性变质岩储层，为了规划额外的井，需要在不确定性下进行决策。不确定性分量包括裂缝密度、裂缝开度、井位渗透率及其空间分布、相对渗透率和断层导水率。问题是如何评估，更重要的是，如何减少基于测量数据的储层模型的不确定性（即，测井和地震数据）和历史数据（即，生产率和压力）。2. 为例2.1. 现场案例BEL是不确定性量化和反演的综合框架[41]。BEL不是一种方法，而是一种基于先验贝叶斯推理的协议。它使用GSA来建议有效的逆方法（即，历史匹配），并且它使用观测（即，本研究中的生产历史数据）作为证据，通过从先验分布中学习来推断模型假设[24]。一般来说，BEL由六个阶段组成[23]：(1) 决策问题的公式化和预测变量的定义;(2) 先验不确定性模型的说明(3) 蒙特卡罗模拟和先验不确定性模型(4) 数据和预测变量的GSA(5) 减少数据的不确定性(6) 后伪造和决策。这项工作旨在量化油藏建模和模拟过程中的不确定性;它对应于框架中的第2-5阶段。2.2. 地质背景和生产历史研究区为中国近海天然裂缝性潜山油藏。储层由变质岩组成，是不渗透的。在被埋到地下之前，储层的顶部被风化，形成了储存和流体流动的能力。天然裂缝是由风化作用和构造运动共同作用的结果在储层的上部区域钻取了五个生产井，在储层的相对较低的部分被四个注入井包围（附录A中的图S1（a））。有两口探井已钻，但未投入生产或注入。J. Fang，B.龚和J·凯斯工程18（2022）116118-储层中的流体为油和水，在1880 m附近通过恒定的油水接触面（WOC）分离（图11）。附录A中的S1（b））。该油藏于2015年9月开始产油收集了5口生产井的生产历史数据（附录A中的图S2）。观测数据是所有生产井的产油率（OPR）、产气率直至二零一九年三月，任何生产井均无产水。2.3. 储层建模数据和先验不确定性提取静态模拟和流动模拟在构造模拟、岩石物理模拟、流体模拟和岩石物理模拟等方面仍有许多不确定性。在本节中，我们将描述可用于描述储层特征的信息以及整个建模和模拟过程中的不确定性来源。量化的不确定度参数及其分布列于表1，整个建模工作流程如图所示。1 .一、2.3.1. 结构不确定性水库分为三个垂直区域（附录A中的图S3（a））。储层与非储层之比随风化程度自上而下逐渐减小。46个断层（附录A中的图S3（b））被解释为三维地震蚂蚁跟踪属性（附录A中的图S4）。所有断层的位置都是确定的，而断层的导电性仍然是不确定的，因为断层的导电性很难确定。在水库里测量在这里，我们简化了故障传导性的不确定性为两种情况：完全密封和完全打开。2.3.2. 岩石物理性质不确定性岩石物理性质，如孔隙度和渗透率，具有不确定性。在这种情况下，基质孔隙度从测井曲线测量。测量地震声阻抗（附录A中的图S4）以指示孔隙度的空间变化。应用co-SGS方法，以测井解释为“硬”数据，地震属性为“软”数据，模拟了三维物性分布。在矩阵属性建模过程中，不确定性建模参数包括变差函数参数、地震属性与井眼属性的相关系数。在井的位置不测量基质渗透率。因此，我们根据过去的经验提供了一个先验。基质渗透率的空间分布受孔隙度的制约。2.3.3. 断裂特性裂缝可能对流体流动有相当大的影响。现有4口井（2口生产井和2口勘探井）利用成像测井直接测量裂缝信息，包括裂缝密度和方位。裂缝密度的空间变化可以通过地震方位各向异性来指示（附录A中的图S4）。本文采用共序高斯模拟（co-SGS）方法，对地震方位各向异性立方体约束下的三维裂缝密度模型进行了模型参数的变异函数、相关系数等与地震属性的关系是不确定然后，利用裂缝建立随机DFN模型，表1不确定性参数及其分布。模型全局参数变量名称先验不确定性单位相主变差函数范围MajorVarioFacies U（500，3000）m次变差函数与主变差函数之比MinorVarioFacies U（0. 3，1. 0）m垂直变差函数VertiVarioFacies U（2，10）m主变差函数方向VarioDirectFacies U（-90，90）°岩石物理性质主要变差函数范围MajorVarioPoro U（500，3000）m次要变差函数与主要变差函数的比率MinorVarioPoro U（0. 3，1. 0）m垂直变差函数VertiVarioPoro U（2，10）m主变差函数方向VarioDirectPoro U（-90，90）°地震阻抗与孔隙度的系数CoImpedancePoro U（-1.0，0.5）-矩阵孔隙度乘数MtrxPoroMulti U（0.5，1.5）-裂缝密度裂缝密度主变差函数范围MajorVarioFrac U（500，3000）m裂缝密度次变差函数与主变差函数之比MinorVarioFrac U（0.3，1.0）m裂缝密度垂直变差函数VertiVarioFracU（2，10）m地震各向异性对裂缝密度的系数CoSeisAzimuFD U（-1，1）-裂缝密度的主变差函数方向VarioDirectFrac U（-90，90）°DFN裂缝孔径FracAperture Log-U（-2.2，-1.3）mm裂缝方位角的方向变化DirectVariFracAzimu U（-90，90）°裂缝长度分布形状FracLengthShape U（2，3）m最大裂缝长度MaxFracLengthU（100，200）m最小裂缝长度MinFracLengthU（5，30）m最小显式裂缝长度MinExplicitFracLength U（100，MaxFracLength-10）m裂缝浓度FracConcentration Log-U（2，5）-流体油密度油密度U（920，960）kg·m-泡点压力泡点压力U（80，120）MPaGas–oil气体密度GasDensity U（0.75，0.80）kg·m-岩石物理最大毛细管压力MaxPc正常（0.1，3.0）MPa Cp = 0时的水饱和度SwPc 0U（0.6，Sorw）-初始含水饱和度Swi U（0，0.4）-剩余油饱和度Sorw U（0，0.3）-岩石压缩性岩石压缩性U（0.00004，0.00700）m断层性质断层封闭/开放场景FT 1/FT 2/. . /FT 46二进制-Cp：毛细管压力; U：均匀; GOC：33J. Fang，B.龚和J·凯斯工程18（2022）116119Fig. 1. 储层建模和储层模拟工作流程。密度、裂缝取向、裂缝长度分布、裂缝孔径等。裂缝的方位受断层走向的制约，而裂缝方位与断层走向的偏差是不确定的。DFN模型，然后升级到连续的网格属性使用Oda方法[50]以降低流体流动模拟中的计算复杂性。2.3.4. 岩石和流体性质的不确定性裂缝使得很难获得岩石物理测量和流体与岩石之间的相互作用。在这种情况下，储层没有直接的测量方法，如岩石压缩系数、相对渗透率曲线、初始含水饱和度或毛细管压力。因此，我们参考了以前的研究[8，51]和类似的储层，以确定岩石物理性质和不确定性范围。压力-体积-温度（PVT）属性，包括泡点压力，石油和天然气密度，和其他流体分布参数，如气-油接触（GOC），和油-水接触（WOC），被视为不确定的，通过引入一个范围内的参考（基本情况）值由石油公司提供。2.3.5. 所有先验不确定性基于贝叶斯模型的不确定性量化需要模型参数化的先验声明和每个参数的概率分布。在前几节的不确定性来源分析中，我们观察到许多方面的属性是不确定的，包括岩石物理性质、流体储存、PVT、岩石物理以及由不同尺度的裂缝引起的空间非均质性。一方面，在整个建模和仿真过程中，我们尽量考虑每一个可能的不确定参数，以避免遗漏重要参数。另一方面，我们需要平衡模型的复杂性和计算需求，以解决多个不确定性的负担能力。不确定参数的详细名称和分布见表1。2.4. 静态建模、流动模拟和蒙特卡罗模拟由于地下系统的物理模型是高维的和非线性的，需要蒙特卡罗模拟。先验模型中指定的每个变量根据其概率分布进行采样，以通过蒙特卡罗模拟生成单个模型实现。正演模型采用双孔双渗模型以计算生产数据作为对不确定参数变化的响应。采用PETREL和ECLIPSE E100两种商业软件分别进行静态建模和油藏正演模型函数可以形式化如下：d¼ gd矩阵;m裂缝;m断层;m流体;mrock其中gd是将模型映射到数据变量d（模拟生产数据）的确定性函数。mmatrix是基质模型;mfrac是裂缝模型;mfault是断层模型;mfluid是流体模型，包括流体接触面和PVT;mrock是岩石物理模型，包括岩石压缩系数、毛管压力和相对渗透率。地质建模和储层模拟的整个工作流程如图1所示。我们从表1的分布中对所有不确定参数进行蒙特卡罗抽样; 1000个模型（图1）。附录A中的S5）并生成模拟。图2显示了与生产历史相比的模拟生产数据。可以看出，对于一些生产曲线，先验似乎覆盖了观察结果，例如井P1、P3、P4和P5的气体速率。P3井的BHP曲线并非如此。P_1的压差和P_2的气速有一定的覆盖度，但随时间变化趋势不同。这些结果表明，即使考虑到许多方面的不确定性，先验是不够的。在下一节中，我们将开发一种系统的方法来识别先验的错误，更重要的是，我们如何在先验被证伪时纠正它。3. 方法3.1. 贝叶斯证据学习一旦建立了前向函数，就必须检查所定义的先验模型是否是伪造的。一个被伪造的先验意味着先验陈述没有提供信息来覆盖观察结果。因此，后验计算将是不可靠的。在概率方法中，通常试图证明先验模型是不正确的，而不是证明它是正确的（即，拒绝“先验模型预测数据”的零假设）。如果先验模型不能被证伪，那么它所做的解释就被加强了，但不一定证明是正确的。证伪过程可以通过验证来实现：①模型再现了系统中已知的物理变化，或者②模型可以预测观测数据。J. Fang，B.龚和J·凯斯工程18（2022）116120图二、使用表1中定义的先验的模拟数据。后者不需要匹配历史数据（即，观测数据，dobs），而是指示使用等式（1）生成的数据响应的总体内的观测数据的概率（1）不为零。这种证伪过程已在许多先前的研究中使用[25，42，52]。开发先验模型通常是迭代的，这意味着先验模型的第一选择往往被伪造。根据先验模型被证伪的原因，可能需要通过增加①模型复杂性、②参数不确定性或③两者来调整先验模型。当数据变量为低维时，通过目视检查可以直接进行篡改检测在这项研究中，数据变量是高维的，这意味着需要一个系统的方法基于Mahalanobis的方法已经引起了人们对伪造检测的关注。Yin等人。[24]使用鲁棒的Mahalanobis距离（RMD）方法来检测具有多高斯分布的先验。在实际应用中，模拟的生产数据可能不是高斯分布。Alfonza和Oliver[48]使用观测值和模拟集合之间的Mahalanobis距离的近似值来诊断先验模型参数。他们的方法可用于高斯和非高斯数据，以及具有大量数据的大型模型然而，他们的方法侧重于接受多少样本来改进先验模型。这些结果并没有给出先验模型是否被证伪的直接标准单类支持向量机（SVM）是一种流行的离群值检测方法[41，53]，其中在数据空间中拟合围绕样本的最小任何落在超球面之外的观测都被归类为与先验不一致。使用核，一类SVM提供了一个强大的工具，用于检测异常值在高维和非线性决策边界。我们采用一个单类SVM作为证伪方法来诊断先验模型。3.2. 全局灵敏度分析分析蒙特卡罗模拟的另一种方式是借助于GSA，其调查什么模型参数（或其组合）影响响应（例如，模拟生产）。GSA方法基于蒙特卡罗抽样，其中所有参数都是联合变化的[54]。在这项研究中，我们使用基于距离的广义敏感性分析（DGSA）方法进行GSA[55，56]。DGSA是一种区域化的GSA方法[57]，它将样本数量减少到少量类别中。然后计算先验累积分布函数（CDF）和类别条件CDF之间的距离，以测量灵敏度。DGSA的一个优点是它支持所有类型的输入参数分布，例如连续、离散和基于离散的分布。DGSA的另一个优点是它考虑了计算机模型[41]的可能高维响应，这通常是地下系统的情况。我们使用DGSA从两个方面来帮助先验的反伪造第一个方面是当前先验模型参数的调整DGSA通过过滤掉非敏感参数，降低了模型的复杂性，简化了反伪造另一个方面是，通过增加新的不确定参数，可以增加先验模型的复杂性。DGSA可以检查新模型参数的有效性。在应用程序中，我们将展示如何DGSA可以用来识别问题时，先验模型是伪造的。3.3. 用数据如果先验不被证伪，则可以进行适当的贝叶斯不确定性量化。完整的贝叶斯方法估计J. Fang，B.龚和J·凯斯工程18（2022）116121ð ÞXd函数P（d）的似然|在先验分布P（m）下发生。模型P（m）的后验分布|d）然后通过下式计算：Pdjm P m树木的。Boosting回归树方法使用较弱估计器的结果，通过组合每个弱分类器的强度来增强预测性能[65，66]。Boosting方法的树是顺序生成的每一步，树Pm j dPd估计器使用早期估计器进行训练，将简单模型拟合到数据，然后分析数据的错误。的权重然而，在具有高维和不同分布类型的参数的真实情况下评估似然性在计算上是昂贵的-或者完全不可能的[58]。在这里，我们采用ABC方法来生成变量的后验分布[58，59]。ABC方法的根源是拒绝抽样。ABC通过比较模拟数据和观测数据来近似似然函数在ABC方法中，如果模型m的模拟数据gdm接近于观测数据dobs，则模型m被接受。因此，这方法绕过精确的似然计算[60]。的概率随着数据维数的增加，生成与观测数据距离较小的可接受模型的概率会降低摘要统计量是从数据中计算出来的值，以最简单的形式表示如果模拟数据集的汇总统计量与观察数据集的汇总统计量之间的距离为e，则可接受样本的分布是后验的近似值，由下式给出：fem j d fmZPd jmI d g dm;d obsed 3<其中I（d（gd（m），dobs）e）是定义窗口大小e的汇总统计量，定义了可接受区域。<重要的是要强调，除非数据d是足够的，近似误差不消失的e？ 0[58，60]。另一方面，接受率随着数据变量d的维数的增加而降低。然后，我们应该增加e，这会导致较低质量的近似值。基于这些局限性，我们必须：①生成尽可能多的模型m的实现，并将模型m模拟为数据d; ②降低数据变量d的维数。由于具有数百万网格单元的现场情况的DFN建模和仿真非常耗时，因此生成与ABC方法所需的一样多的实现是不切实际的因此，需要一个代理模型，这将在下一节中解释。3.4. 代理模型3.4.1. 树基回归我们执行基于树的回归[61]代理模型来取代耗时的静态和前向建模。使用树状拓扑，基于树的方法基于输入空间的二进制分区和在分区区域中采用常数的模型y模型输出是分段不连续的，其可以用公式表示如下：My¼cmIx 2Rm 4m¼1其中cm是常数;Rm是分区区域;I（x）是M个区域上离散指示函数的线性组合。回归树的优点是它适用于连续和分类输入变量，这在地质问题中经常出现。然而，由于分段的性质，回归树方法权衡回归精度。它的预测精度低于大多数其他方法[62]。3.4.2. 围篱树‘‘Boosting”然后增加具有更显著误差的样本最终估计量采用估计量序列的加权组合梯度提升是提升方法的扩展;它结合梯度下降算法来优化可重构损失函数。每一代的新树试图恢复实际值和预测值之间的损失[65]。使用树的Bagging（bootstrap）聚合[64]创建了从训练样本中随机选择的几个数据使用数据的每个子集独立地训练树估计器最终的估计量是通过平均从不同的树与这些自助样本生成的所有估计量来创建的随机森林[67]方法是装袋法的一种推广。除了随机选择数据子集之外，它还随机选择输入特征，而不是使用所有特征来生长树。这个扩展可以处理缺失值，保持缺失数据的准确性，并且可以很好地处理高维数据4. 反证伪与不确定性量化：一个案例研究4.1. 证伪鉴定现在我们回到案例研究，并遵循BEL协议的顺序我们已经说明了先验不确定性，并进行了蒙特卡罗模拟，因此，下一步是伪造检测。我们将模拟数据和观测数据映射到低维空间，然后在低维空间上进行离群点检测测试，以进行伪造检测。在这里，我们使用主成分分析（PCA）降维。图 3显示了不同响应和孔的主成分（PC）评分图。如图3所示，一些观测值（红点）与模拟数据点（灰点）相距较远，如P3井的BHP和P2井的气速有些观测值接近模拟点，但覆盖范围不够，如P1井的BHP、P1井的产气率和P3井的产气率。井P2的BHP似乎没有被伪造，因为观察点在PC 1和PC 2图中的先前点内。然而，它在更高的维度中被证伪了这可以在PC2和PC3图中看到（图1）。 4）.因此，我们定义的先验是错误的，也就是说，它被证明是不正确的。我们需要一个系统的方法来识别问题与先验。任何修订都需要增加不确定性、增加复杂性或执行两者的某种组合。简单的特别修改，如参数上的乘数，是非贝叶斯的[40]。相反，我们将把这个问题表述为一个假设检验。我们将对先验进行修正，把它说成是一个假说，然后试图把它当作一个假说来拒绝。4.2. 假设1：当前不确定参数的不正确分布为了确定先验的问题，我们执行DGSA进行敏感性分析。结果（图5）表明，裂缝开度是最敏感的参数。PCA图（图4）显示，更靠近观察点的点更可能具有更大的裂缝孔径值。那些两个特征表明裂缝孔径分布可能太窄。因此，我们增加了断裂J. Fang，B.龚和J·凯斯工程18（2022）116122---图三. 每个生产井和数据类型的数据的PCA图。灰点是模拟的，红点是实际的现场观察。图四、P2 BHP数据的PCA图（a）PC 1和PC 2图;（b）PC 2和PC 3图。点的颜色表示裂缝孔径值。红点是观测值的PC，而其他点是先验数据的PC。孔径分布从1.3到0.2，并且下限保持为2.2。在增加先验的裂缝孔径范围后，我们重新进行蒙特卡罗和储层模拟以生成先验数据（图11）。附录A中的S6）。图图6显示假设1的先验数据（蓝点）和初始先验数据（灰点）的比较。可以看出，假设1的数据点对观测的覆盖率更高这表明假设1是正确的。然而，先验仍然是伪造的，即使数据比初始先验具有更多的观测覆盖率如图6、P2井气速观测点和P1井井底压力观测点仍在模拟点之外。因此，我们应该提出新的假设来解决先前的问题。4.3. 假设2：增加模型复杂性-动态可传递性如图2所示，P1井的BHP历史曲线在生产过程中不断下降。然而，模拟的曲线更平坦，这意味着在模拟中井孔具有比现实中多得多的流体供应。一个潜在的原因是渗透率是压力相关的，即渗透率随储层压力动态变化。针对裂缝性储层的几项研究[9，10]我们在定义中忽略了这个机制前一任的。Chen等人[10]报道了裂缝渗透率随储层压力下降而变化的幂律关系。函数如下：J. Fang，B.龚和J·凯斯工程18（2022）116123--m图五、P2井BHP资料不确定性参数敏感性分析见图6。假设1的数据与初始先验数据的比较。kk0e3cf1mmabp-p0ð5Þ模拟曲线（附录A中的图S8）和PCA图（图S8）上的覆盖率。附录A中的S9）。DGSA结果表明，其中，p0是参考压力，p是储层压力，k0是p0时的裂缝渗透率，cf为岩石压缩系数，m为泊松由于没有关于研究区域的泊松比和Biot系数的信息在油藏模拟中，我们使用动态渗透率乘数（附录A中的图S7）来表示这种现象。当模型中加入动态传递率乘数时，蒙特卡罗模拟结果具有更大的观测值。动态传输率乘数对模拟数据敏感（图1）。附录A中的S10）。这些证据表明，该假设是正确的，它应该考虑在先验模型。然而，对P2井的气体速率点（附录A中的图S9）的更仔细检查表明，观察结果仍然超出了先前的数据点。图S9中的生产曲线表明，P2中的气体速率的生产历史在2018年之后增加，而模拟曲线不具有该特征。P2井的井底压力观测值在生产历史中呈下降趋势。这表明，我们建立的模型仍然不够复杂，无法反映生产中剩余的所有功能-J. Fang，B.龚和J·凯斯工程18（2022）116124表2假设2和假设3中先验的修正。参数分布描述假设2中添加的参数参数添加到DynamicTM U（0，0.09）较大的值表明，储层压力PermFracDRSU（-3，0）裂缝渗透率从顶部到底部的降低程度。假设3FaultNetCase两种地质情景PoroVolMultiZone3两个地质场景是否使用图7底部区域是否使用孔隙体积乘数托里。这种现象的可能原因是压力供应不足，导致在井P1和P2的区域中脱气。这是合理的，因为水库的最高峰位于该地区。4.4. 假设3：增加模型复杂性-降低生产商压力供给来源于两个方面：底层水和注水井。我们引入了两个额外的不确定性参数-裂缝孔径从顶部到底部的减小程度（图7（a））和底部区域的孔隙体积乘数（图7（a））。 7（b））-表示来自底层水的压力供应不确定性。在原始断层网络（图7（c））中，可以看出生产井P1和P2与附近的注入井INJ1和INJ2之间没有被断层这意味着，即使断层被完全封闭，生产者和注入者之间仍然存在一些联系这可能是P1井和P2井压力供应充足的原因。在这里，我们定义一个变量来表示我们是否使用修改的故障网络。增加的参数如表2所示，故障修改策略如图所示。 7（c）.然后，我们进行蒙特卡罗模拟生成先验数据。模拟结果（图）附录A）中的 S1 1 显示，一些BHP曲线表现得与井P1和P2的现场观测更加一致。更重要的是，P2井的一些产气率曲线在2018年后开始增加，这在以前的研究中没有发现。PC 1和PC 2的先验数据点对观察结果具有良好的覆盖性（附录A中的图S12 DGSA结果（图）附录A中的S13）也揭示了假设3应该包括在先验中。到目前为止，我们已经对低维PC评分图进行了目视检查。现在，我们包括所有PC维度，并使用系统方法来检测伪造。我们使用一个单类支持向量机，一个离群点检测方法，进行篡改检测。其逻辑是，如果观测值是相对于模拟观测值的离群值，则先验被证伪。我们采用单类SVM，而不是基于马氏距离的方法，因为数据分布不是高斯分布（图1）。 8（a））。在单类支持向量机中，所有的模拟数据都被认为是训练样本，用于训练分类模型。然后使用训练好的模型计算观察分数。具有负分数的观测值被认为是离群值，这意味着先验是伪造的。图8（b）显示，当训练数据中包含10个包含99%以上信息的PC时，观察分数仍然为正。这表明先验是不被证伪的。见图7。假设3中的模型修改。(a)渗透率的一种实现，考虑到裂缝孔径从顶部到底部的减小程度;（b）3区孔隙体积乘数的一种实现;（c）断层修正。INJ：注射器。mD：毫达西。J. Fang，B.龚和J·凯斯工程18（2022）116125图8.第八条。使用单类SVM进行离群点检测（a）使用PC 1和PC 2的 SVM结果;（b）考虑到高维PC，使用SVM模型的观察预测得分4.5. 代理模型训练贝叶斯定理允许我们通过计算后验分布来减少不确定性。在这项研究中，我们采用ABC计算后验分布，这需要足够的先验实现。因此，需要代理模型来建立参数与仿真结果之间的统计模型。在这里，我们采用了两个基于树的回归技术-随机森林和梯度提升-建立参数和模拟曲线到观测值的距离之间的关系。我们使用所有的不确定参数作为回归模型的输入。目标输出（标签）是模拟与观察的不匹配;因此，我们的输出是一个缩放器（距离）。所有数据曲线在被聚集之前在0和1之间缩放，以捕获来自不同井和不同数据类型的特征。我们使用75%的样本作为训练集，25%作为测试集。图9示出了随机森林模型与梯度推进模型的相关系数均不显著，分别为0.83（图9（a））和0.85（图9（b））。随机森林和梯度增强模型的测试数据集的相关系数分别为0.72（图9（a））和0.77（图9（b））。梯度提升回归模型似乎在训练和测试数据集上都有更好的性能。然而，随机森林模型在距离值较小的样本上具有更好的性能，这一点更为重要因为这些样本更接近观测结果。图图9（c）比较了随机森林模型和梯度提升模型之间的排序校正。可以看出，随机森林模型在考虑与观测值接近因此，我们选择随机森林模型作为代理模型。4.6. 后验全局参数分布和数据通过ABC方法计算参数的后验分布。首先，我们生成先验参数的50000个实现。然后通过随机森林模型计算预测距离。在ABC程序中，我们使用1.1的值作为选择后验样本的标准（附录A中图S14）。图10比较了一些敏感参数（例如，裂缝开度、油密度、以及井P1和P2的区域的断层修改）到它们的先验分布。敏感参数的不确定性显著降低。最后，为了验证不确定性降低是否有效，我们使用更新后的参数重新建立地质模型和模拟模型，然后运行实际流动模拟。图 11示出了使用更新的参数的仿真曲线。结果表明，整个工作流程是有效的，因为后验曲线更接近观察曲线。为了进一步改进匹配，可以拒绝被认为与生产历史太远在匹配时应考虑计算复杂性，见图9。代理模型性能。(a)随机森林;（b）梯度提升;（c）随机森林和提升模型的秩相关性。（a）和（b）中的蓝点表示训练数据集上的预测性能，而橙色点表示测试数据集上的预测性能J. Fang，B.龚和J·凯斯工程18（2022）116126见图10。（a）敏感连续参数和（b）分类敏感参数的先验和后验分布。历史在本研究中，每个建模和仿真实现的平均时间约为30分钟。由于我们只使用Monte Carlo模拟而不是迭代匹配，因此可以使用并行计算来加快先验和后验模型的生成。5. 讨论和结论在几个实地案例研究中，先前的伪造一直受到关注[24，42，49]。在现场应用中，特别是对于我们知之甚少的情况，必须声明非伪造的先验在本研究中，我们在初始先验中考虑了许多不确定性即使如此，事实证明，前者是伪造的。许多关于历史匹配的论文没有提到证伪步骤。通常情况下，专门的修改是这样做的，但没有公布;只有一个技术的应用进行了研究，并强调其成功。然而，这通常不是工程师在实际情况中面临的最重要的问题在反证伪过程中，通过使用灵敏度分析和降维，很容易识别当前不确定参数分布过窄的问题，例如假设1（第4）中的裂缝孔径问题更具有挑战性的部分是发现重要的不确定性J. Fang，B.龚和J·凯斯工程18（2022）116127图十一岁使用后验参数模拟数据曲线在先前的定义中被忽略的，这需要大量的领域知识和经验。例如，在本研究中，我们认为故障位置和连通性在初始先验中是确定的。如果没有地震解释的领域知识，数据科学家或油藏工程师会发现这种识别具有挑战性。另一种方法是与来自不同领域的专家进行深入讨论，以确定每个领域的不确定性，如地震解释，测井解释和生产管理。考虑到建模和仿真的计算复杂性，我们生成了1000个实现，然后使用了替代模型。统计代理模型总是会降低不确定性降低性能。我们使用基于树的代理模型，因为一些输入参数是分类的。然而，基于树的回归模型牺牲了一些回归精度，因为它在每个节点中使用分段平均如果地质模型和转发模拟时间可以容忍运行数万到数百万次实现，则不需要代理总之，我们提出了一个系统的方法来诊断虚假的问题，先验的不确定性量化的一个真正的裂缝性油藏的情况下。所提出的方法集成GSA，降维，蒙特卡罗抽样。我们证明了该方法是有效的，在确定一个既定的先验太小的不确定性和模型的复杂性不足。更重要的是，该方法可以诊断出现场数据中存在的冲突，如本研究中的断层解释和生产历史，因为这种冲突经常发生在现场地质研究中，测量不同方面的数据。确认我们感谢国家留学基金管理委员会、中国地质大学（武汉）、特雷西能源技术有限公司、和斯坦福地球资源预测中心对这项研究的支持。作者特别感谢Markus Zechner、Zhen Yin和Yizheng Wang的技术讨论和支持。遵守道德操守准则Junling Fang、Bin Gong和Jef Caers声明他们没有利益冲突或财务冲突需要披露。附录A.补充数据本文的补充数据可在https://doi.org/10.1016/j.eng.2022.04.015上找到。引用[1] 布尔比奥湾裂缝性储层模拟：一个具有挑战性和有益的问题。石油天然气科学技术2010;65（2）：227-38.[2] AzizmohammadiS，Matthai SK. 天然裂隙岩石的渗透率与尺度有关吗？WaterResour Res2017;53（9）：8041-63.[3] 纳尔逊RA。地质分析的自然裂缝性水库第2Woburn编：GulfPublishing Company;1985.[4] TurcottDL，Moores EM，Rundle JB. 超级水力压裂今日体育2014;67（8）：34-

下载后可阅读完整内容，剩余1页未读，立即下载