利用Landsat-8卫星数据与人工智能探测南非Assen铁矿床异常

75 浏览量更新于2023-12-06 收藏 3.11MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

地球科学中的人工智能3（2022）71利用Landsat-8号卫星遥感数据对南非Assen铁矿床进行基于人工智能的异常探测陆地成像仪格伦·T Nwaila a，*，Steven E. 张a，b，Julie E. 布尔多a，b，优素福·古尔巴尼c，伊曼纽尔·约翰·M 卡兰萨da威特沃特斯兰德大学威特矿业研究所，1 Jan Smuts Ave.，南非约翰内斯堡b加拿大地质调查局，601 Booth Street，Ottawa，Ontario，K1A 0E8，Canadac瑞典吕勒诺布尔理工大学土木、环境和自然资源工程系，SEd南非布隆方丹，纳尔逊·曼德拉博士205号，自由州大学地质系，邮编：9301A R T I C L EI N FO关键词：异常探测铁矿Lansat-8遥感机器学习勘探找矿A B S T R A C T大多数已知的矿藏是使用昂贵、耗时和基于知识的方法偶然发现的，所述方法诸如河流沉积物地球化学数据、金刚石钻探、勘测地球化学和地球物理调查和/或遥感。近年来，随着新发现矿床数量的减少和对关键原材料需求的增加，勘探地质工作者寻求更有效和更有创造性的方法来处理矿产勘探不同阶段的各种数据类型。遥感因其覆盖面广、成本低而成为早期矿产勘查最受欢迎的工具之一。来自卫星的遥感图像是公开提供的，可用于岩性测绘和矿产开发。在这项研究中，我们扩展了一种基于人工智能的非监督异常检测方法，利用Landsat-8业务陆地成像仪（OLI）卫星图像和机器学习来识别铁矿床的存在。我们的方法的新颖性包括：（1）知识引导和无监督的异常检测，不假设任何特定的异常签名;（2）异常检测仅发生在变量域中;（3）选择一系列机器学习算法，以平衡可解释性和性能。我们的新的无监督方法通过三个连续的阶段检测异常，即（a）阶段I在这项研究中，新的方法进行了测试的阿森铁矿在德兰士瓦超群（南非）。它探测到了已知的阿森铁矿区和其他矿床阿森铁矿周围不为人知的特征为了总结该地区的异常情况，对所有建模频带的重建误差使用分量分析。我们的方法增强了阿森矿床作为一个异常和衰减的背景，包括人为的结构异常，从而大大提高了视觉对比度和描绘的铁矿床相对于背景。结果表明，该方法具有较好的鲁棒性，可用于矿产勘查目标的圈定。特别是，该方法将在没有关于异常的存在或具体光谱特征的数据标签的地区，如未开发勘探的矿床，是有用的。1. 介绍卫星遥感是地质测绘和（或）矿物探索，特别在他们的早期阶段（Diaz-Rodriguez等人，2021年）。从各种平台获得的遥感数据以及地面测量数据的多样性和质量的极大提高，使地球科学家能够提出创造性和有效的数据分析方法，以协助勘探* 通讯作者。电子邮件地址：glen.nwaila@wits.ac.za（G.T.Nwaila）。https://doi.org/10.1016/j.aiig.2022.10.001接收日期：2022年5月7日;接收日期：2022年8月28日;接受日期：2022年10月5日2022年10月17日在线提供2666-5441/© 2022作者。Elsevier B. V.代表KeAi Communications Co. Ltd.提供的出版服务。这是CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表地球科学中的人工智能杂志主页：www.keaipublishing.com/en/journals/artificial-intelligence-in-geosciencesG.T. Nwaila等人地球科学中的人工智能3（2022）7172各种矿床类型（Rajesh，2004年; Song和 Ying，2015年，2020年;Shirmard等人，2022年）。遥感是勘探各种矿床类型的重要技术，包括那些位于难以进入的地区的矿床或那些显示出地表足迹但位于对地面勘探具有政治和环境敏感性的地区的矿床（Ciampalini等人， 2013; Ali等人，2015年）。此外，卫星遥感提供了比标准区域地球化学勘测高几个数量级的空间分辨率（例如，Zhang等人，2022年）。大多数用于绘制矿床图的常用遥感技术都侧重于使用各种图像处理技术，如假彩色合成、波段比和主成分分析（PCA）来增强卫星图像（Ciampalini等人，2013年; Beiranvand Pour和Hashim，2014年）。波段比值分析是多光谱遥感图像变域矿产资源定位的常用方法。它依赖于波段比率的数学组合来手工制作反映区域岩性和矿物学的地图（Agar和Coulter，2007年;Asokan 例如，2020年）。这些方法利用不同波段记录的矿物和土地覆盖物的差异光谱特征。波段合成可以用主成分分析来解释不同的波段。光谱信息或物体识别中的作用（Amer例如，2010; Noori等人，2019年）。对于这些手动方法，从光谱数据中可靠地提取信息的能力取决于若干因素，例如用户在选择最佳频带组合和信号处理方面的经验（Shirmard等人，2022年）。以条带状铁建造（BIF）为主体的铁矿床是遥感研究最多的矿床之一。这部分是由于大多数铁矿床显示出近地表特征，并且出现在远离城市基础设施的地区，这不利于使用人工调查方法（Ciampalini等人，2013年）。在遥感学科中，光谱中反射最强烈的被含铁矿物反射或吸收是已知的（例如，含有三价铁（Fe3+）的矿物提供宽的并且部分地受到强烈的大气扰动的影响）。数据复杂性的一般定义是不固定的，并且取决于任务的上下文（例如，已知类型的目标异常）和由数据捕获的背景（Wavelola等人，2009年）。然而，这可以通过应用学科特定的知识来限制，这允许减少检测到的异常的数量。在无监督意义上，异常的描述不是先验已知的，并且不存在数据标签。矿床的出现在地质学上是比较罕见的，发现一个相对于卫星遥感数据的空间覆盖范围来说当然是罕见的。但是，如果矿床所在地暴露在地表上，则构成一种物理异常，可以捕捉到这种异常，因此可以在遥感数据（或其他类型的数据）中进行探测。将探测矿藏的存在作为一项人工智能任务显然是可行的。然而，在遥感数据中可以捕获的一般异常不仅可以包括矿床的出现，还可以包括人为结构、瞬时事件（例如，火灾或洪水）以及传感器故障等数据质量问题（Barnett和Lewis，1978年;Hawkins，1980年）。后一种类型的非地质相关异常可以位于任何带中，包括由于巧合而具有目标地质相关性的带，但是通常用作主要补充矿床勘探中的地球物理学、地球化学和地质学的勘测工具（例如，对于未开发勘探和勘测设计），使用任何方法发现的异常都需要人工核查或有针对性的勘探，以进一步确定其性质和有用性。在异常检测中，使用表现出空间分量的数据，异常检测技术对这样的数据的应用可以在空间域或可变域或这两个域的组合中。这两种方法之间的关键区别在于背景的构建，其目的是评估数据的正态性。在空间域方法中，假设异常呈现空间相干图案，并且因此应用数字图像处理算法来提取这样的图案（例如，光栅化对象）。这已经是对空间数据（诸如遥感数据）的成功方法，并且已经开发了几种类型的方法，包括：（1）匹配滤波器（例如，Reed-Xiaoli算法，参见Reed和Yu，1990）;（2）背景细化方法（例如，BACON al-出租，参见Billor等人，2000;概率检测器，参见Gao等人，2014）;以及（3）基于双边滤波器的方法（例如，Yao和Zhao，2018）。这些基于空间或数字图像处理的异常检测算法中的一些利用显式线性表示（例如，矩阵），其仍在被改进以适应多个对象表示（例如，Tan等人，2019年）。这些技术在地球科学界探测矿藏方面的使用有其局限性。比如芦苇-小丽算法是一通用空间域异常这是一种功能上与PCA相反的检测器这样一来，U-可以在图像中检测到像矿藏的常见异常事件。然而，经常检测到的异常不一定具有地质相关性，并且异常性的阈值化（以检测或多或少异常的项目）不受地质科学直觉的驱动。在双边滤波器的情况下，它们试图保留图像的边缘，并且可以被视为降噪技术。通过减少背景噪声，可以锐化突出特征，因此可以识别一些异常。然而，期望矿藏会表现出明确的边缘或其他空间特征，可以使用过滤方法明确地检测出来，这是天真的。一般来说，空间方法可能不适用于矿床的检测，因为它们的空间足迹（例如，几何形状、连续性和大小）通常不是先验已知的，并且对于相同类型的矿床可能是高度不一致的（与人造结构不同，空间异常检测似乎对人造结构非常有效）。相比之下，可变域响应对于类似类型的矿床基本上是不变的（例如，BIF含有含铁氧化物的矿物，而不管它们的物理足迹或位置如何）。这为在变量域中而不是在空间域中使用异常检测来执行矿床检测提供了强有力的基础。虽然遥感数据的分析似乎一般在空间域中相对更常见，可变域包含大部分编码信息。在非空间数据的情况下或者对于在可变域中具有过高维度（相对于空间维度的数量）的数据，异常检测可以单独地或者有效地在可变域中进行(e.g.、检测地球化学化探异常通常，它们不太可能包含精确的光谱特征，数据）。EX X信号处理（不基于人工与数据覆盖的比例相同。这突出了对利用现有学科特定知识来检测特定类型的异常（在这种情况下是地质相关性）的方法的需要。各种矿物的差分光谱反射特性和感兴趣的适当带宽可能是最有用的学科特定知识类型，可以利用这些知识来定位感兴趣的波段，以使用人工智能来定位特定光谱内的异常。这种方法将基本上整合学科特定的知识，否则完全数据驱动的异常检测。然而，由于遥感诸如光谱特征匹配和光谱解混（Beiranvand Pour和Hashim，2014）的方法对于检测特定异常是有效的，其中感兴趣的异常的确切特征是已知的。在变域中，如果异常本身在物理上相似，则空间分离的异常的光谱响应将相似，这显然是类似类型的矿床的情况。在现代多光谱或超光谱数据的情况下，可变域在维度上是丰富的，并且通常其维度远远超过空间域的维度。然而，在高维数据空间中检测广义异常是计算密集型的G.T. Nwaila等人地球科学中的人工智能3（2022）7173并且需要一种在可变域中对背景进行建模的方法，由于维数的原因，可变域可能相应地比空间域中的背景更加复杂。对于这项任务，机器学习算法是非常有能力的，并且已经知道一些更灵活的类型在变量域中的广义异常检测中是成功的（例如，Morales-Forero和Bassetto，2019; Zhou和Paffenroth，2017; Zhang等人，2021年、2022年）。在所有这些情况下，其想法是机器学习算法学习数据集中的正常数据行为，并通过预测建模复制它。在其中一些情况下（Zhang等人，2021，2022），模型捕获数据内已知用于捕获所寻找的异常类型的一组维度与其它维度之间的关系。在数据驱动的遥感背景下，模型作为隐含的背景下重建的训练数据中最常见的行为下的一些性能约束。差重建意味着所涉及的数据相对于背景是异常的，并且重建误差（例如，Zhang等人的预测残差，2021年，2022年）是衡量数据点可靠性的指标。机器学习通常用于分析光谱数据，探测矿床的出现（ Cracknell 和 Reading ， 2014 年 ; Har-vey 和Fotopoulos，2016年; Bachri等人，2019; Chakouri等人， 2020年）。遥感和机器学习的结合有助于地质科学家克服知识驱动方法的一些缺点，例如解释者的主观性和手工制作模型的简单性（例如，波段合成和比率），以及一些特定于遥感的问题（BeiranvandPour等人， 2016，2019; Lary等人，2016; Dai等人，2017），如模型主体性，以追求更可靠，客观和可解释的前景图，从而降低勘探成本和风险。已经使用了用于许多不同任务的各种算法（Madhuanand等人，2021年）。遥感的几种机器学习应用集中在土地利用或覆盖、植被和水分类上（Mather和Tso，2009年; Sehgal，2012年; Al-doski等人，2013; Madhuanand等人，2021年）。尽管在过去，已经通过在其他领域（例如，An和Cho，2015年），在地球化学勘探之外没有浅层学习（Zhang等人，2021年，2022年）已尝试用于远景映射。据我们所知，尽管机器学习经常用于异常检测（特别是在一般意义上，在遥感和勘探之外），但所使用的异常检测通常是深度学习种类（例如，自体，自体编码器），并且在许多严格的科学应用中是不期望的的更可解释的浅学习变化尚未用于在遥感数据的可变域中执行无监督异常检测以定位可能代表矿床的异常。在这项研究中，我们表明，有针对性的数据重建的频带的兴趣，已知包含目标异常是一种有效的方法来提高，因此检测异常。这项工作旨在弥合使用遥感进行勘探的两种不同方法-一种是我们通过完全考虑数据中各种光谱或波段之间的高维关系，以非空间方式对光谱数据进行建模。对于我们确定矿床目标的特定任务，目标是绘制有效的异常图，以确定潜在的目标位置，供进一步调查。我们的方法是无监督的，不需要手动波段操作以外的数据处理，但它是最低限度地指导的先验知识的频带的利益。我们证明，我们的方法能够增强和检测阿森铁矿床（南非）的铁富集特征，作为已知捕获氧化铁光谱的波段内研究区域中任何类型的最显著异常，尽管存在许多人为结构。2. 矿床地质德兰士瓦超群中的古元古代阿森铁矿床位于南非布什维尔德杂岩东翼的克罗埃西亚河穹丘中心附近（图1）。Bushveld杂岩侵入德兰士瓦超群沉积物的热和压力，加上侵入体和沉积岩之间的密度差异，导致沉积序列变形，从而在该地区形成圆顶（图1和图2）。1和2; Gerya等人，2003年）。Assen矿床由富含铁的岩石组成，分为三种岩相（向上地层）： (i)方解石赤铁矿（23 m厚; 40- 50%Fe），（二）高品位赤铁矿（12 m厚;> 60% Fe），以及（iii）BIF（>50 m厚; 35%Fe）。含铁量> 60%的矿体呈不规则板状，厚度约80 m，走向长12 km（图1）。 2）。一一个主要的ENE走向的向斜标志着阿森矿床以东的克罗斯比河穹丘的中心。因此，地层序列在阿森矿走向E-W和下降之间35和60N。在东部和西部，圆顶被3-4公里长的东南-西北走向滑动断层所包围，西部断层与Assen矿的最西部区域重叠。在西部断层附近，岩石被严重角砾化（地表暴露的断层带长达100米）。于矿场租赁区内，已观察到多个小型褶皱及断层。除了褶皱和断层作用外，Assen矿的岩相还发生了塑性变形、部分Meta、交代和重结晶作用。变质矿物包括角闪石（透闪石）、滑石、方解石、结晶石英和白云石，表明接触变质温度为410-510 ℃（Hartzer，1987）。3. 数据和方法3.1. 遥感数据本研究中使用的数据来自美国的Landsat-8 Operational Land Imager（OLI）卫星（合作2013年2月4日从加利福尼亚州范登堡空军基地发射的地球观测卫星（USGS，2022）。这是Landsat计划中的第八颗卫星。在轨、陆地-卫星8号加入陆地卫星7号，扩大了对地球表面的覆盖范围。该卫星是一颗自由飞行卫星，携带OLI和热红外传感器仪器。这两种仪器可以捕获九个可见光、近红外、短波红外和长波热波段的数据。它们提供了高信噪比（SNR）辐射计性能，允许12位数据量化和额外的位，以更好的土地覆盖特性。Landsat-8提供了地球表面和极地地区的中等分辨率图像，范围从15米到100米（Irons等人，2012; Roy等人，2014年）。表1显示了Landsat 8-9 OLI的特性使用美国地质勘探局地球资源观测和科学中心（USGS-EROS，http：//earthexplorer.usgs.gov/）提供的无云Landsat-8级1 T（L1T ，地形校正）图像绘制了 Assen 铁矿床使用通用横轴墨卡托（UTM）地图投影和世界大地测量系统84（WGS 84）基准定义L1T产品。本研究中使用的Landsat-8图像于2021年12月30日采集（坐标参考系统（CRS）来自欧洲石油勘测集团（EPSG）32635 反式-形式：仿射[30.0，0.0，556875.0，0.0，-30.0，-2776785.0]）。公开进修学院本研究中使用的条带是条带1至7。Landsat-8 OLI的全色波段（波段8）和卷云波段（波段9）以及TIRS波段未用于本研究，因为与波段1至7相比，它们的分辨率不一致，而且它们为铁矿床发生编码的信息与其他波段明显重叠。研究区包含了许多人为结构关联与采矿和农业活动，作为以及G.T. Nwaila等人地球科学中的人工智能3（2022）7174（）=Fig. 1. 德兰士瓦盆地的简化地质图，包括布什维尔德火成杂岩，显示阿森铁矿床的位置（红点）。(a)德兰士瓦超群岩石及其盆地在非洲南部的位置。(b)德兰士瓦盆地地图。图修改并更新自Eriksson等人（1995年）。阿森矿区坐标：南纬25< $7′ 44.5692“TML= Thabazimbi-Murchison Lineament。与阿森铁矿床相关的露头和矿石库存（图 2）。3.2. Landsat-8图像处理对于与谷歌地球引擎（GEE）的交互式制图，该引擎是一个具有卫星图像和地理空间信息的数PB数据库的云计算平台，使用Rasterio和GEEMAP Python库对研究区域的Landsat-8 OLI图像进行预处理（Wu等人， 2019; Wu，2020）。预处理涉及通过遥感进行的勘探和地质测绘都受益于这种预处理方法（Cooley等人，2002; Salem等人，2016年）。热带大气和农村气溶胶模型用于将FLAASH算法应用于数据（Manakos等人，2011年）。因此，将原始成像光谱仪辐射率数据重新缩放为反射率数据。在图像预处理阶段之后进行图像处理，以提取具有高Fe和粘土矿物亲和力的谱带的光谱特性。为了进行条带比分析，使用标准定标器对条带进行归一化：最初的图像处理。辐射校正、大气校正、几何校正和噪声去除都在标准定标器带（数据-数据平均值）数据标准差当量1各种预处理阶段。利用仿射变换将获取的卫星影像投影到WGS 84基准面上。应用于矿物勘探和岩性分类的光谱遥感数据的最重要过程之一是辐射校正（Rajendran和Nasir，2014年）。使用辐射校准优化所获取的图像以获得最佳辐射率、反射率或亮度温度，这减少了光谱像素中的误差。本研究采用了光谱超立方体快速视线大气分析（FLAASH）方法，这是一种第一原理大气校正工具，可校正可见光、近红外和短波红外范围内高达3 m的波长（ENVI，2009年）。矿物缩放后的条带用于创建假彩色复合（FCC）图像，并用于条带比分析。FCC将三种不同形式的信息（例如，图像通道）。由于基于单个通道中的值的颜色的绝对差异，颜色合成使人类更容易理解多通道图像数据（Pohl和Van Genderen，2014）。基于特定光谱特征的FCC彩色合成图像改进了岩性和矿物辨别（Salem等人，2016年）。谱带比是不同谱带的简单算术组合，允许半定量研究G.T. Nwaila等人地球科学中的人工智能3（2022）7175带6=等式4图二. 谷歌地球卫星图像显示，农业结构，基础设施和主要地质结构附近或与阿森铁矿床有关。坐标：西矿体=-25.127248<$，27.590647<$;中矿体=-25.125509<$，27.597720<$;东矿体=-25.124558<$，27.607325<$。表1Landsat 8-9 OLI和热红外传感器的特性（http：//earthexplorer.org）usgs.gov/）上提供。黑色的Fe2+）带比=带5方程式2谱带名称和描述波长（μm）分辨率（m）铁。fe3+的）波段比=Band4+Band6带5频带1 -沿海气溶胶0.43带2-蓝色0.43波段3-绿色0.53波段4-红色0.64波段5 -近红外0.85除了与氧化铁相关的带比，还有其他的带比;例如，粘土带比（方程式10）。（4）），其利用了诸如粘土和明矾石的含水矿物吸收电磁波谱的2.0-2.3 μ m部分中的辐射的事实（Rowan 等人，1974;Goetz and Rowan 1981），因此：波段6 -短波红外短波1（SWIR 1）波段7 -短波红外2（SWIR 2）1.572.11粘土带比带6带7波段8-全色0.50第9波段-卷云1.36波段10 -热红外1 10.6波段11 -热红外211.50特定吸收或发射特性（Sabins，1997）。例如，在该技术中，一个频带的数值除以另一频带的数值。根据所考虑的地形覆盖和矿床类型，已广泛采用和开发了许多用于岩性和矿物制图的波段比率。（Carranza和Hale，2002; Gad和Kusky，2006; Vicente和Filho，2011;Pour等人，2019; Shevyrev和Carranza，2022）。在这项研究中，编码亚铁/三价铁（Fe2+/Fe3+）用于评估铁矿床产状异常（以然而，尽管OLI波段6和7通常用于检测粘土矿物，但植被反射率曲线的形状和相对强度与粘土矿物重叠。3.3. 基于机器学习的预测建模在本研究中使用机器学习算法的目的是检测已知包含一些感兴趣信息的可变域中的一组频带上的广义异常（即，已知的铁矿床）。然而，这些异常并不是先验已知的。因此，我们的异常检测任务是完全无监督的。然而，与其尝试波段的所有组合（这可能会产生大量与地质无关的异常），我们使用超背景铁氧化物浓缩）使用无论是传统现有的学科特定知识，波段比率表明，带比图和我们基于机器学习的异常增强和检测方法。对于亚铁和氧化铁矿物的检测，相关的OLI带是4、5和6，并且这些带的幅度被数学地操纵以创建知识引导的复合物。波段比可以减轻由于地形引起的照明变化。三价铁谱带比对低浓度的三价铁也很敏感。高值的铁矿物比率可用于检测三价氧化铁的晶体场吸收（Rockwell，2013）。二价铁和三价铁OLI波段比率分别为：波段4、5和6包含与三价铁和二价铁氧化物最相关的信息（Rockwell，2013年）。这意味着，为了加强铁矿床异常，应重建波段4、5和6，而其余波段可用作特征。因此，对于频带4、5和6而言，重建较差的光谱信息被称为异常。本申请中基于机器学习的预测建模用于对数据驱动背景进行建模，这是与现有空间方法相比不同的方法（Maxwell等人，2018年）。空间坐标仅用于绘制地图，而不用于预测建模。异常的强度是通过当量3G.T. Nwaila等人地球科学中的人工智能3（2022）7176重建误差，为此我们选择预测残差，其对应于预测频带幅度减去实际频带幅度。一旦增强，异常的检测可以通过残差图的视觉检查和/或后处理算法的应用来完成，所述后处理算法例如阈值化、模式匹配、连续性分析或其他合适的空间异常检测方法。从这个意义上说，我们的方法可以作为一个独立的方法，并作为预处理方法，如果结果是由其他方法，如通过数字图像处理的空间异常检测。为此，在图像处理程序之后使用所有波段，仅根据机器学习的需要进行额外的重新缩放。对于数据重新缩放，重新缩放所有频带，使得它们的幅度跨越0和1之间的统一范围。这允许用作机器学习特征的带同等地影响算法（其中算法需要重新缩放;不需要重新缩放的算法不受影响）。应用包含关于氧化铁的最相关信息的带的知识使该方法成为数据和知识驱动的混合方法。因此，我们的方法假设这种类型的异常的存在是跨光谱带差分捕获的，并且这种差分特性不能被光谱分析充分解释。可变域的一般背景。我们有意采用浅层学习方法，并包括一系列算法来了解其可行性。这对于科学目的很重要，因为预测建模性能不是最重要的结果，而是结果的可解释性和方法的可复制性。在这项研究中探索的算法包括k-近邻（kNN），支持向量机（SVM），随机森林，自适应增强（AdaBoost）和人工神经网络（ANN）。这些算法代表了多种潜在有用的方法，包括简单的非参数方法（kNN），参数方法（SVM），集成和提升方法（分别为随机森林和AdaBoost）和基于神经网络的方法（ANN）。这些算法的细节以及它们的超参数在Zhang等人（2021，2022）中有充分的描述。虽然这些算法是有监督的机器学习算法，但监督被应用于构建最佳捕获特征和目标之间的关系的模型（以在可变域中对背景进行建模），但不是特征和标记的异常之间的关系（数据中没有可用的标签）。用预测残差（预测值减去实际条带振幅）表示的关系强度通过这种方式，我们对机器学习的应用是无监督的。然而，预测模型的建立需要明确的控制，模型可概括性和准确性、这是取得使用5重交叉验证进行模型调整和选择。我们采用决定系数（CoD）度量进行模型调整和选择。算法的参数网格如表2所示。表2所有机器学习算法的参数。关于它们的定义及其对算法行为的影响，请参见Zhang et al. （2021年，2022年）。算法参数网格kNN k={1，2，3，4，5，6，7，8，9，10，11}SVM C={10，100，200，400，600，800，1000}，ε={0.00001，0.0001，0.001，0.01，0.1，0.5，1.0}，核={线性，径向基函数有两种类型的异常图可以从预测残差构建，即，单波段地图和多波段合成。出于我们的目的，我们不依赖于手动波段比率来为基于机器学习的异常图创建多个波段组合。相反，我们使用PCA来重新协调波段以创建合成。在第一主成分中捕获了最显著的异常。以这种方式，可以完全自动地创建最重要到最不重要的异常图然而，PCA并不是唯一适合总结多个波段异常的算法;其他算法（如核PCA）也可能适用（尽管本研究未探讨）。在适当的情况下，也可以使用更复杂但更难解释的方法（我们认为我们在这项研究中的机器学习应用是科学的，因此证明我们的方法与解释能力的需求是兼容的。在其他应用中，这种约束不需要应用，因为不确定性和可解释性的概念可能不适用。为了创建映射，使用Lanczos算法对预测残差或预测残差的组合进行插值，该算法可用于平滑数字图像，并已用于优化插值图像以进行平移或旋转（Turkowski和Gabriel，1990）。所得到的图像使用颜色地图，扫描通过发光（从暗到亮）和色度（从红色到蓝色）域来描绘数据对比度。4. 结果4.1. 波段可视化和波段比图像在图像处理之后，波段4、5和6表明最高像素强度对应于许多人为结构，主要是农田（图1和2中的圆形结构）。第3-5段）。带4捕捉了阿森铁矿的一些结构，这些结构表现为采矿基础设施特征的骨架连接（图3的中心）。波段比图像（二价铁和三价铁的氧化物和粘土）显示，研究区域的人为结构表现出高反射率（图1和图2）。6-8）。此外，没有一个波段比图像能够清楚地隔离阿森铁矿床的出现。然而，亚铁和铁矿物的比例图（图。图6和图7）清楚地显示了阿森铁矿床附近的高反射率值，而粘土矿物比率图（图8）显示了相反的行为。这意味着使用机器学习选择波段4、5和6作为预测目标是合理的。4.2. 基于机器学习的异常增强和检测算法选择表明，平均而言，基于树的方法（随机森林和AdaBoost）和kNN模型的背景在波段4、5和6上最好（图9）。这些算法之间的性能差异通常可以忽略不计（大约百分之几），这似乎表明，难以解释的复杂机器学习模型对于生成高性能和实用的背景模型是不必要的。此外，kNN算法执行超参数优化的执行时间比基于树的方法短约三个数量级，这意味着可以牺牲微小的绝对性能，以换取大量的重新-随机（RBF）}降低计算成本。为了更好地重建数据，我们包围圈大小={500，1000，1500};最大深度={3，1，无限}，最大特征数={1，2，3，4}，分割的最小样本数={1，2，3，4}，通过详尽的交叉验证，根据CoD度量（R2）得分对算法进行排名，然后使用最佳算法/AdaBoost人工神经网络叶的样本={1，2，3，4}分类器的数量={100，200，500}，基础算法=具有与随机森林算法相同的参数网格的决策树，α={0.0001，0.001，0.01，0.1，1.0}，激活={identity，logistic，tanh，relu}，学习率={constant，inverse scaling，adaptive}，最大迭代次数={1500，2500}，隐藏层大小={0.0001，0.01，0.1，1.0}{100，150，200}每个波段的模型。由于每个波段都是使用其自己的工作流程（算法和模型选择）建模的，因此将所有波段限制为单个算法/模型没有特别的理由，这将导致每个波段的特定算法/模型的性能不如最佳。这种方法首先在Zhang等人（2022）中使用，其中作者指出，尽管在不同的环境中存在性能差异森林G.T. Nwaila等人地球科学中的人工智能3（2022）7177图三. 研究区域上方的波段4图像。该区域的光谱响应以颜色映射到谱带强度。圆形物体是农业结构。图像中心的骨架和斑块状构造是与阿森铁矿床有关的构造见图4。研究区域上方的波段5图像。该区域的光谱响应以颜色映射到谱带强度。圆形物体是农业结构。阿森铁矿床（中心）不可见。各种算法，在其重建误差和空间足迹方面的异常的相对大小在定性上是相似的。表3中示出了每个频带的最佳性能算法的优化超参数。值得注意的是，AdaBoost在波段6中排在第二位（由于图9中CoD指标分数的小数点后3位，这并不明显）。通过随机森林或AdaBoost产生的条带6的异常图在视觉上难以区分。一般而言，第二最佳和第三最佳组合产生视觉上相似的图，这是基于模型的CoD值（未示出）预期的目视检查所有条带的预测值与实际值（图10）表明，条带4的预测性能最好，而条带5的预测性能最差。这表明异常的平面尺寸必须在带5中最大，在带4中最小。这在预测残差图上确实观察到了。对于带4、5和6，预测残差图显示带4中的微弱和较小的异常（图11），带5中铁矿床附近的显著异常（图12的中心），甚至更有选择性地在带6中（图13）。这与Assen矿床的挖掘足迹和矿石储存相对应，两者都是由于当地采矿活动。为了进一步总结波段4、5和6内的关键异常，我们使用了基于PCA的方法生成该地区最大到最小异常的三个地图（图1和图2）。14-16）。异常的主成分1（PC1）图捕获了Assen铁矿床（图14的中心）。相比之下，PC2和PC3地图没有显示出与该地区当时的矿床有关的重大异常。在所有特定波段和基于主成分的地图中，与原始特定波段地图相比，人为结构被大大抑制（图11和12）。3 -5）和波段比图（图 6-8）。5. 讨论本节重点介绍了我们提出的方法与传统的波段比/波段组合方法的主要区别，传统的波段比/波段组合方法通常用于处理光谱数据，以检测矿床的出现。讨论还包括对所提出的方法的影响的意见，勘探目标的矿床occurrences具有类似的性质，在其他地质矿产。G.T. Nwaila等人地球科学中的人工智能3（2022）7178图五. 研究区域上方的波段6图像。该区域的光谱响应以颜色映射到谱带强度。圆形物体是农业结构。Assen铁矿床（中心）没有得到很好的捕获。图第六章在研究区域使用波段比得到的氧化铁（暖色调）图像。该区域的光谱响应以颜色映射到该比率。见图7。研究区域的氧化铁图像是使用波段比产生的。该区域的光谱响应以颜色映射到该比率。G.T. Nwaila等人地球科学中的人工智能3（2022）7179见图8。研究区域的粘土含量图像（暖色）。图像是使用波段比产生的。该区域的光谱响应以颜色映射到该比率。见图9。机器学习算法选择的结果，通过所有测试波段的CoD（决定系数）度量进行测量。这里kNN是k-最近邻，SVM是支持向量机，AdaBoost是自适应增强，ANN是人工神经网络。表3最佳预测结果来自最佳网格。特征的最小数量=1，叶的最小样本数量=3，采用，先验知识的波段，捕获亚铁和三价铁的氧化物的反射是关键，在我们的能力，子集的整个数据集的功能和目标。在没有这种知识的情况下，系统地划分所有波段组合的子集并识别相关异常可能更困难或更耗时。原始波段图中突出的人为结构（图1和图2）。6 -8）在预测残差图中得到很好的抑制（图6 - 8）。11-13）。然而，这是因为两个因素：（1）这样的结构以足够的频率出现，使得预测模型能够将其特征结合到背景中;以及（2）这样的结构包含宽带信息，这些信息也在用作特征的一些频带中被捕获。对于（1），随着人为结构的出现越来越多，它们在波段之间的关系越来越多地被纳入基线，因此，它们的信号通过机器学习模型变得更好地构建。对于（2），随着特征和目标之间的关系对于任何结构变得更强，它们越来越成为背景的一部分。具有与背景明显不同的特征的稀有对象不能被充分抑制，因此成为检测到的异常（例如，图14中的异常）。这意味着数据的空间覆盖范围应该足够大等的的发生的无趣现象频率足够高，因此不能被视为异常。不可以利用现有的遥感数据直接控制因子（2）。在我们对矿床异常检测的无监督方法中，异常的定义可以概括为：在感兴趣的区域内，在先验知识的背景下罕见但相关的光谱特征。从这个意义上说，对于类似的应用，遥感是用来检测矿床的出现，BAND6随机森林0.929147分割的样本数=4，包围圈大小=500最大深度=无，最大要素数=2，叶的最小样本数=4，分割的最小样本数=3，包围圈大小=1500保留在频带上有差异的任何签名（例如，已知的岩石盖层、扩散序列或表面蚀变成分），我们期望我们的方法能够增强和检测异常，从而有助于矿床的检测。由于我们的技术不是特定于矿床类型的异常，我们进一步预计，BAND5 AdaBoost 0.766057最大深度=无，最大数量特征的最小数量=1，叶的最小样本数量=3，拆分样本=4，Encampaign大小=2005.1. 基于机器学习的矿床产状异常检测对于阿森铁矿床和遥感数据，我们的方法可用于增强或检测其它形式的表面异常。然而，这仍有待于在每个目的和每个应用程序的基础上得到积极的证明。5.2. 基于PCA的感兴趣的频带的先验知识的应用提供了将数据子集描绘为目标的手段。利用主成分分析将这些波段的异常组合起来似乎是一种有效的方法带方法Cod参数BAND4AdaBoost0.978775最大深度=无，最大数量G.T. Nwaila等人地球科学中的人工智能3（2022）7180见图10。针对频带的预测与实际，使用表3中的算法和参数，按照频带5（CoD=0.766）、频带6（CoD= 0.929）和频带4（CoD= 0.979）的CoD增加的顺序。请注意，波段4的重建效果最好，这意味着它包含的异常量最少见图11。使用AdaBoost（自适应增强）算法的预测残差图。预测残差在此图中以颜色映射。一个暗蓝色的微弱中心物体大致是阿森铁矿床的足迹见图12。使用AdaBoost（自适应增强）算法预测残差图像。预测残差在此图中以颜色映射。中间的红色物体大致是阿森铁矿床的足迹以顺序地提取该区域中从最大到最小的异常，其中最大的异常在第一主分量中被捕获。从这个意义上说，PCA取代了高度具体的数学模型，频带幅度，例如频带比。在我们的应用中，PC 1地图清晰地捕获并描绘了Assen铁矿床（图14），这是亚铁或三价铁氧化物地图无法比拟的壮举G.T. Nwaila等人地球科学中的人工智能3（2022）7181图十三. 使用随机森林算法预测残差图像。预测残差在此图中以颜色映射。中间的红色物体大致是阿森铁矿床的足迹图14. 研究区内异常的主成分1（PC1）图。预测残差在此图中以颜色映射。地图中心的亮红色异常主要与Assen铁矿的挖掘足迹相对应图15个。研究区内异常的主成分2（PC2）图。最显著的异常点在地图的左下角G.T. Nwaila等人地球科学中的人工智能3（2022）7182图16. 研究区异常的主成分3（PC3）图。除了阿森铁矿的一些足迹（地图中心），没有其他明显的异常。（图2）6和7），这两个都是少得多的选择性，并包含人为结构的

下载后可阅读完整内容，剩余1页未读，立即下载