基于过采样法和随机森林算法的海相页岩气优质储层快速识别

170 浏览量更新于2023-12-06 收藏 874KB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

地球科学中的人工智能2（2021）76基于过采样法和随机森林算法的海相页岩气优质储层快速识别朱琳琪a，b，周学清a，b，*，张朝模ca中国科学院深海科学与工程研究所，中国b海南省海洋地质资源与找矿重点实验室，三亚，572000c长江大学油气资源勘探技术教育部重点实验室，武汉，430100A R T I C L E I N F O保留字：海洋页岩气过采样随机森林优质储层识别A B S T R A C T优质海相页岩气藏的识别一直是勘探开发阶段的重点工作然而，由于测井曲线响应与优质储层之间存在严重的非线性关系，优质储层的快速识别一直是一个精度不高的问题为提高基于测井资料的优质储层识别精度，提出了过采样方法与随机森林算法相结合的方法采用过采样方法平衡不同类型的样本数量，采用随机森林算法建立高精度、高质量的储层识别模型。从预测效果来看，结合过采样方法和随机森林算法的储层识别方法，将储层识别的准确率从其他机器学习算法的44%提高到78%，效果显著。该研究可提高优质海相页岩气储层的可识别性，指导水平井钻井，为精确制定海相页岩气开发方案提供切实帮助。1. 介绍能源是永恒的必需品，化石能源占总能源使用量的巨大比例（Huanget al.， 2018; Pang等人， 2021; Aldhuhoori等人，2021年）。随着勘探开发的不断深入，常规油气储量越来越低以页岩气为代表的非常规油气藏越来越受到人们的关注. 以美国和中国为首的国家已经开始从页岩中提取天然气（Zhu et al.，2021 a-c; Pang等人， 2021; Aldhuhoori等人， 2021年）。海相页岩气藏的研究已开始认真开展，相应的研究认识发展迅速。页岩气储层太致密，需要基于水平井技术的天然气开采（Sheng etal.，2020; Hou等人，2021; Wilson等人， 2016年）。相应地，高效准确地识别优质储层已成为关键一步。仅用岩心资料难以准确评价整口井的垂向变化，因此需要利用测井资料进行储层识别。目前，最常见的优质储层识别方法仍然偏向于定性分析。例如，Maet al. （2020）提出了利用T2几何平均值对龙马溪页岩气储层进行评价。 Wang等人（2016）分析并阐明了牛蹄塘组优质页岩气储层的地化录井、核磁共振录井等特殊测井响应。Yan等人（2014年）讨论了使用测井响应定性识别优质储层的可能性。He等（2016）分析了各泥页岩相的测井响应特征，并识别出有利相。虽然定性研究较多，但定性识别方法显然不能满足页岩开发阶段的需要。定量和快速的储层识别更为重要。一些学者提出了一种基于地图的线性储层定量识别方法（Liu和Sun，2015; Li等人，2020; Zhu等人，然而，大多数泥页岩储层的测井响应与储层类型的关系具有非线性特征，图版法显然不能满足这一要求。Tahmasebi等人（2017）使用数据挖掘和机器学习方法来识别页岩甜点层，并进行纯粹的数据驱动页岩甜点层识别。 Zhang等人（2021）使用IPSO-SVM算法结合元素测井* 通讯作者。中国科学院深海科学与工程研究所，三亚，57200。E-mail地址：ZhouX q@idsse.ac.cn（X. Zhou）。https://doi.org/10.1016/j.aiig.2021.12.001接收日期：2021年7月22日;接收日期：2021年11月23日;接受日期：2021年12月1日在线预订2021年2666-5441/©2021作者。出版社：Elsevier B.V.代表科爱通信有限公司公司这是CC BY-NC-ND下的开放获取文章许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表地球科学中的人工智能杂志主页：www.keaipublishing.com/en/journals/artificial-intelligence-in-geosciencesL. Zhu等人地球科学中的人工智能2（2021）7677ðÞnX随机森林…例如树-1树-2树-3甲级b类c类多数表决最后一级图1.一、随机森林预测过程。曲线来识别页岩地层中的最佳点 Amosu等人（2021）使用支持向量机有效识别Eagle Ford页岩中的优质储层。Vikara等人（2020年）使用机器学习信息集成框架解决Marcellus页岩储层的有效分类问题虽然已经提出了多种针对页岩的优质储层识别方法，但在低硫层的识别方面仍存在一些问题。首先，最大的问题是，由于核心抽样不可避免的偏差，用于建模的样本集不平衡。这将导致某些类型的储层不容易预测，当优质储层不容易识别时，情况会更糟。其次，不同算法的非线性拟合能力也不同，导致预测效果的差异。提出了一种优质海相页岩储层快速识别框架，该框架结合过采样方法和随机森林算法，可快速识别页岩气井中的优质储层。该方法显著提高了优质储层的识别效果，可为海相油气藏树的根节点，并通过选择最佳列属性来不断分裂，以逐个构造树节点，直到达到树构建的停止条件;例如，叶节点中的数据都是同一类别。与神经网络等算法相比，决策树具有很强的可解释性。从根节点到叶节点的每条路径代表一条规则，决策树基于这些规则进行分类或预测。在进行预测时，决策树从根节点开始确定到叶节点的唯一路径叶节点中样本的多数根据选择分类属性时应用的不同标准常见的决策树生成算法是基于香农熵分裂的ID3和C4.5，以及基于基尼系数分类的CART（Tewari和Dwivedi，2019）。当用于分类任务时，C4.5算法是最常用的算法。决策树分裂使用信息增益比作为分裂准则，计算为：页岩气藏2. 方法grX;YgX;Y公司简介（一）在这项研究中，有两种主要技术应用于储层识别任务：过采样方法（Tao等人，2020; Sol-tanzadeh和Hashemzadeh，2021）来解决不平衡数据和随机森林算法（Ao等人， 2020年; Feng等人， #20201;解决问题。结合这些可以达到快速识别的目的gX;YHY-HYjX（2）其中g（X，Y）是指事件的信息增益和不确定度，其通过从熵中减去条件熵来计算。信息增益比增加了惩罚项H（Y|（十）基于信息增益。罚款的计算公式为：由于缺乏经验的地层评价人员和储层识别模型的差异，可以识别优质储层并缓解储层识别准确性问题。H.YjX轴Xi¼1piHYjX¼xi！（三）2.1. 随机森林随机森林是一种基于决策树的集成学习算法该算法利用Bootstrap技术从原始样本中抽取随机样本，构建单个决策树。在决策树的每个节点处，使用随机特征子空间来选择排序点。最后，将这些决策树组合起来，通过多数表决获得最终的预测结果。在我们对随机森林有更深入的了解之前，我们需要首先介绍决策树，因为它是随机森林算法中的基本分类器。决策树是一种广泛使用的树型分类器。东起相应地，熵的计算公式为：nHp-pi log2pi（4）1/1熵越大，包含的信息量就越大，不确定性就越大。决策树的建立本质上是通过制定规则对数据进行逐层区分，使分类后数据的不确定性逐渐降低。决策树是一个单一的分类器。虽然它的解释性很强，但由于其自身模型的局限性L. Zhu等人地球科学中的人工智能2（2021）7678性能改进，这导致训练和预测准确性不令人满意针对这一问题，采用集成学习算法对多棵决策树进行Bagging和Boosting是集成学习中的两类算法Bagging算法从原始数据中均匀随机采样，使得集合中每个基本分类器的训练独立于其他分类器。随机森林算法的过程可以分为三个部分：①样本的Bootstrap抽样，即在构建树（训练模型）的开始，从训练数据集Dn中进行随机抽样，抽样相同数量的n个数据点。②进行随机特征子空间的选择每一个抽样形成的新的子数据集被用来构造相应的随机森林决策树。当分割树节点时，首先从最原始的D特征中随机采样m个特征（m

下载后可阅读完整内容，剩余1页未读，立即下载