苏里格气田日产量预测模型及可行性研究

29 浏览量更新于2023-12-06 收藏 906KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

地球科学中的人工智能2（2021）165数据驱动的苏里格气田日产量时间序列预测方法张琦a，陈紫薇b，原增a，高航a，韦乾生a，罗条玉b，Zhiguo Wangb，*a中国石油长庆油田分公司第三采气厂，内蒙古乌审旗，017000，中国bXi交通大学数学与统计学院，陕西省Xi，710049A R T I C L E I N F O保留字：生产时间序列的预测长短期记忆神经网络随机森林支持向量机A B S T R A C T苏里格致密气田是目前中国最大的气田由于苏里格储层渗透率特低、非均质性强，生产井数已超过3,000口，十年来保持了稳定的供气。因此，气井日产量预测对生产监测、增产措施的实施和评价具有重要意义。因此，在三种数据驱动的时间序列方法的基础上，对苏里格地区1692口井10年来的日产量进行了挖掘，用于井的日产量预测。通过引入递归神经网络的时序表达能力，提出了深度长短期记忆和全连接神经网络（DLSTM-FNN）联合模型，并与随机森林（RF）和支持向量回归（SVR）模型进行了比较。通过对苏里格气田数千口井的日产量预测，该DLSTM-FNN模型在短训练样本下显著提高了时间序列预测精度和效率，在苏里格致密气田具有较强的可用性和实用性。1. 介绍苏里格气田位于中国鄂尔多斯盆地西北部自2011年以来，它已成为中国最大的气田（H。Yang等人，2012年）。由于沉积作用、成岩作用和成藏作用（T。 Yang等人， 2012年; Zou等人， 2012; Jiang等人，2007），苏里格气田储层渗透率特低，非均质性强，导致气井产量低。因此，在过去十年中，苏里格气田的井数不得不迅速增加，以不断扩大产能。随后，积液井、间歇井、低产井逐渐增多，整个气田的生产管理更加复杂。因此，研究不同气井在不同阶段的生产规律，特别是预测生产动态、监测生产异常，对气井的全生命周期管理至关重要，有助于天然气的长期稳产保供。目前常用的气井产量预测方法可分为基于物理模型的数值模拟和基于统计规律的产量递减曲线分析油藏数值模拟利用计算机模型来估计多孔介质中的流体动态数值模拟需要大量的静态地质和动态生产数据来实现精确的地质建模和高质量的历史拟合。因此，动态模拟计算时间长，预测结果与气田实际生产结果存在偏差。在油藏工程中，人们提出了许多递减曲线分析模型来预测油气产量。早在1945年，Arps就提出了经典的指数递减模型、双曲线递减模型和调和递减模型（Arps，1945）。Chen等人在中国提出了广义下降模型、线性下降模型和泛指数下降模型（Chen和Tang，2016;Chen和Zhou，2015;Chen和Fu，2019）。然而，在上述递减模型中选择致密砂岩气的参数从而限制了其在生产动态预测中的应用。最近，在可用的生产数据的基础上，各种机器学习方法，特别是神经网络，已经成功地用于选择影响井生产的特征参数，然后在监督学习框架下预测油气井生产（Cao等人，2016; Hou，2019; Liu等人，2019，2020;Gu等人，* 通讯作者。电子邮件地址：emailwzg@gmail.com（中）Wang）。https://doi.org/10.1016/j.aiig.2022.02.005接收日期：2021年12月15日;接收日期：2022年2月25日;接受日期：2022年2022年3月3日在线发布2666-5441/©2022作者。出版社：Elsevier B.V.代表科爱通信有限公司公司这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表地球科学中的人工智能杂志主页：www.keaipublishing.com/en/journals/artificial-intelligence-in-geosciencesQ. Zhang等人地球科学中的人工166.;ð Þ¼2019年）的情况。然而，在上述油气井产量预测方法中，无论是物理模型驱动还是数据驱动算法，都更侧重于以月或年为单位的中长期产量预测，较少涉及致密气田全生命周期的单井日产量时间序列预测和异常监测（Dong andYang，2009; Sagheer and Kotb，2019; Jiang et al.， 2021年）。因此，考虑到日常生产时间序列的当前和过去状态，我们提出了一种基于长短期记忆（LSTM）神经网络的深度网络预测方法，并将其与随机森林（RF）和支持向量回归（SVR）等传统数据驱动的机器学习方法进行了比较。2. 数据驱动方法2.1. 随机森林与支持向量回归决策树（Decision Tree，DT）是一种有监督的学习算法，它在已知所有事件概率的条件下，通过构造决策过程并计算相应的数学期望值来它可以表示为树结构，其中内部节点表示不同级别的决策方案，叶节点（端点）表示最终的决策结果。然而，它们往往过于拟合。因此，集成学习方法通常用于取代单个DT，即RF（Breiman，2001）。假设每个DT的预测结果都很好，那么对于不同的数据集存在过度拟合。RF指出，通过构建许多DT并平均其预测结果，可以在保持其预测能力的同时提高DT的鲁棒性RF算法首先进行随机采样并替换数据集，以获得多个新数据集，从而创建尽可能多的不同DT 对于这些新创建的数据集，构造每个DT，并根据特征的不同重要性进行加权平均，以获得RF的预测结果。SVR的模型函数是线性函数。 SVR在线性函数的两侧构造一个区间带。损失不是针对落入间隔带的数据样本计算的，而是针对位于间隔带之外的样本计算的，并且根据特定的损失函数来计算。支持向量机还引入了支持向量机的核函数方法，将算法扩展到高维数据空间。核函数有很多种在本文中，使用高斯核将数据样本x1和x2映射到高维空间，定义为k rbf=1; x2± 1; exp.- γjjx1-x2jj2π;（1）其中γ是控制高斯核的宽度的参数2.2. 递归神经网络对于时间序列，例如气井的日产量，引入了递归神经网络（RNN）（Hop field，1982）来捕获当前时刻和过去时刻之间的相关性。 RNN模型具有以下特点：某时刻的输出将成为下一时刻输入的一部分;对于多层堆叠RNN，不同层的参数可以共享，从而减少了训练参数的数量;输入数据的长度可以可变。图图1显示了RNN的基本结构。令输入数据X1/4/2x0;x1;…;A表示一个结构神经元单元，xt表示第t个网络的输入，ot表示第t个网络的输出，ht表示第t个网络输出的隐藏状态。输入-输出关系可以表示为ht¼ σWxh xtWhh ht-1bh（2）ot¼Whyht-1000Fig. 1. 递归神经网络的结构。其中σ是激活函数，Wxh是应用于xt以计算隐藏状态ht的权重矩阵X，Whh是应用于当前隐藏状态ht以计算下一隐藏状态ht-1的权重矩阵X，Why是应用于隐藏状态ht以计算输出ot的权重矩阵X，并且bh和bo分别是属于隐藏状态和输出的偏移项根据公式（2），网络中任何一层的ht都可能影响后续的输出，这对于处理时间序列具有很强的实际意义。然而，RNN网络在实现输入的长期传输方面具有挑战性当采用反向传播机制更新RNN中的权值时，随着网络层数的逐渐增加，后一层的梯度将乘以前一层的梯度。因此，RNN倾向于梯度爆炸/消失（Bengio等人，1994）。为了解决长期依赖性问题，已经提出了许多网络结构，例如LSTM神经网络和门控递归单元。2.3. LSTM神经网络LSTM是最广泛使用的RNN结构之一（Hochreiter和Schmidhuber，1997）。与传统的RNN结构相比，LSTM在原有基础上增加了记忆和门控单元，可以有效避免梯度的消失/爆炸，并可以提取数据中可能存在的长期相关性。图图2描绘了LSTM单元的示意图。LSTM单元引入了三种类型的门控单元，即输入门、遗忘门和输出门。门控单元的输入和输出的一般方程可以表示为：y<$σWx<$b;（ 3）其中W和b分别是选通单元的权重矩阵X和偏置，并且σ是激活函数。在LSTM中，通常使用sigmoid函数，其表达式为σx1（4）1-x在时间t，LSTM的输入数据由xt表示，输出数据由ht表示，存储单元为ct，表示图二、一段长短期记忆。Q. Zhang等人地球科学中的人工167.Σþ8>对应位元素的乘法，并且输入门i用于确定有多少输入数据xt被分配给存储器单元ct。前向传播过程是itXixtWhfhtbi（5）考虑时间序列中的某些特征对于目标任务可能没有因此，引入遗忘门以减少这些特征在后续时间t n的影响。遗忘门f主要通过如下改变存储单元ct来选择丢弃的样本特征ft¼σ。WxfxtWhiht-1bf;（6）ct¼ftctxc xttanhwwhcht-1\f2（7）输出门o通过存储单元ct和输入数据xt确定网络的输出数据ht。此时，网络的输出ht既考虑了当前输入xt，也考虑了前一个网络（即记忆单元ct-1）学习的内容，其表达式为（8）第100章：一个人的世界（9）总之，对于训练集的样本si，其数据和标签分别为xi和yi 本文最终提出了一种基于深度LSTM 和全连接网络的深度网络架构，即DLSTM-FNN，如图所示。 3. 前向传播表达式为f11/4RNNxi：Q. Zhang等人地球科学中的人工168y-yi2（十一）训练集Dtrain和测试集Dtest。也就是说，对于一个时间序列的y火车和y测试，然后，我们将它们与观测值进行普雷德长度为l，将D的前l个train信息分配给Dtrain，将后l个test信息分配给Dtest。接下来，分别为D训练和D测试构造输入数据x和输入标签y在时间t，我们希望使用t之前某段时间的序列x来预测t之后某段时间的序列y。假设x的序列长度为l x，y的序列长度为l y，在时间t由一对x和y形成的样本为st，则可以在时间t 1生成样本st 1，如图1所示。四、接着图4，对于训练集Dtrain，样本数据集Strain可以被构造为1/2s0;s1;.;s_m_train]，并且样本m_train的数量是l_train_l_x_l_y_l。同样对于测试集Dtest，Stest可以构造为s½s0;s1;.; s m test ]，测试集m test的个数为l test - l x - l y 1.如果将S train和S test分为训练集数据xtrain、训练集标签ytrain、测试集数据xtest和test设置标签y测试，它们的尺寸为：m列;l;n列，m列;l;n列，m测试;l;n列，y训练和y检验来分析回归精度。作为深度学习模型，DLSTM-FNN需要平衡预测精度和计算时间。通过对网络超参数的不断优化，最终，最短序列长度l x被设置为1，标签序列长度l y为1，学习率为0.0001，权重衰减为0.0005，迭代次数为150。在最优超参数下，DLSTM-FNN模型的平均预测速度为67.59s/井，能够满足苏里格油田实际生产异常监测的实时性要求。这里，均方根误差（RMSE）被用作准确度测量，其可以如下给出s1无菌包装X无菌包装。ﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃﬃ ﬃﬃﬃﬃﬃﬃﬃﬃΣﬃﬃﬃﬃﬃ我和t检验;ly;nt。x y xni¼1pred其中yi是当前观测值，yi是它的预测值。为3.2. 结果分析以苏里格地区1692口气井的资料为数据集，分别建立了RF、SVR和DLSTM-FNN模型。首先，我们将x和y的维数分别降为m; l x和m;l y。然后，在x训练和y训练的基础上进行模型训练。训练样本的长度仅占总样本数据的10%，属于短训练样本集。在数据驱动方法的基础上，我们使用训练好的模型预测x训练和x测试，见图4。日生产时间序列的样本组成。以苏里格气田1692口气井为例，表1比较了RF、SVR和DLSTM-FNN三种气井产量动态预测模型在训练集和测试集上的RMSE虽然RF在短训练样本集中的误差最小，为0.0884904，但它在测试集中的误差最大，为0.1878669。 DLSTM-FNN在测试集中的误差最小，为0.1378165，比SVR预测误差小0.03。而且，它的预测也是最好的。为了进一步分析气井的生命周期，以生产3922天和1145天的典型气井S1和S2为例。图图5显示了三种数据驱动模型的气井产量预测结果，表2显示了它们对应的RMSE。对于气井S1和S2，DLSTM-FNN在测试集上具有最小的RMSE，分别为0.0722189和0.1025749。通过比较图在S1气井实测连续生产期（1000- 1500天）、间歇生产期（1500-2000天）和经济无效期（>2000天），DLSTM-FNN能更准确地预测产量趋势和突变位置。在1145天的生产周期中，由于多次停产，S2气井的日产量为零，由于采取了多种增产措施，日产量波动较大在S2气井的预测结果中（图5b，d和5 f），DLSTM-FNN模型更好地预测了零日产量异常和严重波动的位置（图5 b，d和5 f）。5 f）。因此，与传统的RF和SVR相比，数据驱动的DLSTM-FNN模型具有训练样本集短、大规模预测速度快、结果更准确等优点。此外，DLSTM-FNN的预测预计将用于监测生产异常，提供特定的时间窗口，并对增产措施进行定量生产评估。4. 结论本文对苏里格致密气井的日产量预测进行了。应用了三种数据驱动的时间序列预测方法，包括RF，SVR和LSTM。考虑时间序列中当前和过去状态的潜在信息，提出了适合致密气井日产量预测的DLSTM-FNN超参数优化组合。三种数据驱动模型的有效性和实用性表1苏里格1692口气井产量预测模型的RMSE模型训练集测试集RF0.08849040.1878669SVR0.14095830.1636799DLSTM-FNN0.16636120.1378165predRMSE¼Q. Zhang等人地球科学中的人工169图五、预测S1和S2气井日产量的数据驱动方法。（a）：S1上的RF的预测结果（b）：S2上的RF的预测结果（c）：SVR对S1的预测结果（d）：SVR对S2的预测结果（e）：DLSTM-FNN在S1上的预测结果（f）：DLSTM-FNN对S2的预测结果表2S1井和S2井产量预测模型的RMSE型号S1训练套件S1测试套件S2训练套件S2测试套件RF 0.1090542 0.1285114 0.12691090.15872120.0957835 0.1945521 0.1073256电话：0512 - 8888888传真：0512 - 8888888利用苏里格气田1692口井的时间序列对动态日产量预测进行了验证。其中，DLSTM-FNN深度学习模型具有良好的时间序列建模能力。在训练样本集短、上千口井的快速预测中，定量预测性能表明，DLSTM-FNN模型更准确可靠，更符合气井日产量的实际动态趋势此外，基于迁移学习的DLSTM-FNN模型可应用于其他致密气田的时间序列预测资金本研究得到国家重点研发计划（2020YFA0713404）的支持。竞合利益作者声明，他们没有任何商业或相关利益，代表与提交的工作有关的利益冲突引用Arps，J.J.，一九四五年下降曲线分析交易Am. Inst. 分钟金属. 汽油Eng.160（1），228本焦，Y.，Simard，P.，Frasconi，P.，一九九四年学习梯度下降的长期依赖性是困难的。IEEETrans.神经网络的 5（2），157- 166。布莱曼湖，2001年随机森林马赫学习. 45，5- 32。Cao，Q.，Banerjee河，古普塔，S.，例如，2016.使用机器学习进行数据驱动的生产预测。在：SPE阿根廷勘探和生产非常规资源研讨会。SPE，布宜诺斯艾利斯。Q. Zhang等人地球科学中的人工170陈玉，Fu，L.，2019.幂函数递减模型的建立、比较及应用。石油地质记录Ef fic. 26（6），87-91。陈玉，唐，W.，2016.广义递减模型的建立及应用。宠物学报Sin. 37（11），1410- 1413。陈玉，Zhou，C.，中国地质大学，2015.线性递减模型的建立、比较及应用。宠物学报Sin. 36（8），983- 987。董伟，杨，S.，2009.影响产量递减动态的因素及产量预测。国家天然气地质调查局20（3），411- 415。顾，J.，周，M.，Li，Z.，例如，2019.基于数据挖掘的长短期记忆网络模型油井产量预测。特殊油气藏26（2），81- 85，135。Hochreiter，S.，Schmidhuber，J.，1997.长短期记忆。神经元计算9（8），1735- 1780。霍普菲尔德，J.J.，1982.神经网络和物理系统与新兴集体计算能力。在：美国国家科学院院刊，79。美国国家科学院，pp。2554- 2558，8.Hou，C.，2019年。基于长短期记忆神经网络的油井产量预测新方法石油地质记录Ef fic.26（3），105- 110。蒋飞，Pang，X.，蒋志，例如，2007.致密砂岩中气体充注的物理模拟实验。Geol. Rev. 53（6），844- 849。江，Y.，陈旭，Bao，H.，2021.页岩气分段压裂水平井产量递减快速预测新模型--以涪陵页岩气田为例国家天然气地质调查局32（6），845- 850。刘伟，Liu，W.D.，顾，J.，Shen，X.，2019.使用机器学习方法的子层吸水率预测模型。J.汽油Sci. Eng. 182，106367。刘伟，刘伟，顾，J.，例如，2020.基于机器学习方法的石油产量预测。石油钻子产品Technol.42（1），70- 75.Sagheer，A.，Kotb，M.，2019.使用深度LSTM递归网络进行石油产量的时间序列预测。神经计算323，203- 213。杨，H.，傅，J.，刘，X.，Meng，P.，2012.鄂尔多斯盆地上古生界致密气成藏条件及勘探开发。Petrol. EX plor. Dev. 39（3），295- 303。杨，T.，张，G.，Liang，K.，2012.全球致密砂岩气勘探及我国发展趋势预测斯特拉特研究CAE 14（16），64- 68。Zou，C.，中国科学院，杨志，陶，S.，例如，2012.纳米油气与生储共生成藏。Petrol.EX plor. Dev. 39（1），13- 26。

下载后可阅读完整内容，剩余1页未读，立即下载