集成人工智能和机器学习算法提高喜马拉雅地区滑坡灾害空间预测精度

95 浏览量更新于2023-12-06 收藏 3.24MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

地球科学中的人工智能3（2022）14集成人工智能和混合机器学习算法提高Kurseong喜马拉雅地区滑坡灾害空间预测精度苏尼尔·萨哈·阿尼克·萨哈*印度马尔达古尔班加大学地理系A R T I C L E I N F O保留字：多层感知核逻辑回归随机森林多元自适应回归样条混合算法A B S T R A C T目前工作的目的是比较使用机器学习技术，即滑坡的敏感性地图。多层感知神经网络（MLP）、核逻辑回归（KLR）、随机森林（RF）和多元自适应回归样条（MARS）;新颖的集成方法，即Kurseong-Himalayan地区的MLP-Bagging、KLR-Bagging、RF-Bagging和MARS-Bagging 对于集合模型，RF，KLR，MLP和MARS被用作基础分类器，Bagging被用作Meta分类器。目前的工作的另一个目标是介绍和评估的有效性的新KLR袋和MARS袋集成在滑坡的敏感性。通过对303个滑坡地点进行汇编，以校准和测试模型，创建了一个库存利用Relief-F和多重共线性检验选择了18个LCF，用于绘制滑坡敏感性。应用受试者工作特征（ROC）、精密度、准确度、错误分类比例、平均绝对误差（MAE）和均方根误差（RMSE），随后验证了LSM。不同的验证结果表明，具有集成Meta分类器的RF-Bagging（AUC训练88.69%测试92.28%）比基于MLP，KLR，RF，MARS，MLP-Bagging，KLR-Bagging和MARS-Bagging的LSM提供更好的性能。&RF模型表明，坡度、海拔、降雨量和地貌对滑坡的发生起着至关重要的作用。这些结果将有助于减少在Kurseong和其他地区的地质环境和地质条件或多或少相似的滑坡造成的损失1. 介绍滑坡是喜马拉雅地区破坏性更大但更频繁的自然灾害，对建筑物、财产和人类生命造成显著危害（Chawla等人， 2018年）。在印度，查谟-克什米尔、北阿坎德邦、喜马偕尔邦、西孟加拉邦北部、锡金和东北部各邦等&山区受到山体滑坡的严重威胁。根据Froude的工作（2018年），2004年至2016年全球75%的半地震滑坡发生在七个东南部发展中国家（它们是印度，中国，老挝，孟加拉国，缅甸，菲律宾和印度尼西亚）（Chauhan等人， 201 8;Aristi z'abal和S'anchez，2020）。据信，大约有500条生命，Rs.300取芯器（约X.价值30亿美元）的财产已被每年因山体滑坡而受损（Koley等人， 2019; Khamkar和Mhaske，2019）。印度最易发生滑坡的地区是希马拉延山区（Saha和Saha，2020年a）。有大量的技术和模拟用于制定滑坡破坏的减少或缓解计划（Khamkar和Mhaske，2019年; Liao和Liao，2020年; Saha等人，2020年）。管理滑坡危险区（LHZ）需要共同努力，而滑坡敏感性制图（LSM）是减少滑坡影响的常用工具和最有用的技术（Pecoraro等人，2019年）。这些地图有助于特定省份滑坡灾害的可视化和区域预测（Chawla等人， 2018年）。LSM的预测是基于这样的假设，即未来的山体滑坡将在与先前产生山体滑坡的条件相似的条件下发生（Pham等人，2016; Hirota等人，2019年）。只有最小二乘模型显示了特定山区滑坡威胁的地理位置，这些威胁是由当地气候和环境因素造成的（Pham等人，2016年）。滑坡敏感区的监测需要对包括位置、气候条件、滑坡类型和地质环境在内的许多参数进行评估（Mahdadi等人， 2018年）。* 通讯作者。电子邮件地址：aniksahamalda@gmail.com（A. Saha），gmail.com（S. Saha）。https://doi.org/10.1016/j.aiig.2022.06.002接收日期：2022年3月29日;接收日期：2022年6月10日;接受日期：2022年6月12日2022年6月22日在线提供2666-5441/©2022作者。出版社：Elsevier B.V.代表科爱通信有限公司公司这是CC BY许可下的开放获取文章（http://creativecommons.org/licenses/by/4.0/）。可在ScienceDirect上获得目录列表地球科学中的人工智能杂志主页：www.keaipublishing.com/en/journals/artificial-intelligence-in-geosciencesA.萨哈，S。Saha地球科学中的人工15首先，底层地质构造（岩性组成、形成、风化程度）、地貌（斜坡方向、相对起伏和外观）、土壤类型（深度、组成、孔隙度和渗透性）、LULC和气候特性是滑坡的重要内在因素（Reichenbach等人，2018;Amato等人， 2019; Ozioko和Igwe，2020; Saha等人， 2021年）。利用最大似然法（ML）编制最小二乘法（LSM）和选取滑坡制约因子，可以提高滑坡风险降低工程程序 Wang等人（2019）对不太重要的滑坡因素应用了不敏感的集合假设。 Saha等人（2022）利用基于卡方的因素选择技术来筛选关键因素。绘制和识别滑坡高风险区是一种科学上公认的做法，旨在为该地区的规划和改善提供科学基础（Koley等人， 2019; Juliev等人， 2019年）。在过去的几年里，通过对滑坡敏感性进行模拟，有效地减少了损失（JulievFig. 1. 研究区域的位置（A）印度;（B）大吉岭喜马拉雅山;和（C）Kurseong地区与滑坡清单。A.萨哈，S。Saha地球科学中的人工16例如， 2019年）。研究人员已经开发了许多统计方法来解决滑坡问题（Chawla等人， 2018年）。半定量技术取决于因素的加权和评级，例如层次分析法、组合滑坡频率比、信息值、证据权重、模糊逻辑方法和加权线性组合法（Chen等人， 2016; Mahdadi等人， 2018; Saha和Saha，2020 a）。近几十年来，研究人员应用机器学习技术（MLT）来识别世界各地滑坡易发区域中的LHZ（Sevgenet al.，2019; Saha等人，2021），包括支持向量机（Meng等人，2016; Saha和Saha，2020c），决策树（Khosravi等人，2018; KutlugSahin和Colkesen，2019）;核逻辑回归（Chen和Chen，2021）随机森林（Kornejady等人，2019;Saha等人， 2020）、多元自适应回归样条（Liao和Liao，2020）和人工神经网络（Srivastava等人， 2019; Saha等人， 2020年）。 MLT比以前的概率模型具有更好的准确性（Mahdadi等人， 2018; Saha等人，2022年）。在滑坡研究中，不同的MLT在不同的地方发挥不同的本研究以喜马拉雅大吉岭Kurseong地区为研究对象，应用MLP、KLR、RF、MARS、MLP-Bagging、KRL-袋式、RF-袋式和MARS-袋式模型。包围混合机器学习是罕见的，特别是在印度大吉岭喜马拉雅地区，MLP-Bagging被用于伊朗的地面沉降敏感性（Arabameri et al.，2020年）; RF-装袋应用于孟加拉国的木材易感性建模（Talukdar等人，2020）和KLR-Bagging &MARS-Bagging是新颖的集合，仍然没有用于滑坡建模。在这项研究中，由于Metaclassifier和AI模型的集成性能优异，因此在Bagging meta classifier和所有使用的模型（MLP，KLR，RF和MARS）之间进行集成，用于建模滑坡易感性。为了比较和评价这些模型的结果，采用了受试者工作特征（ROC）、精密度、准确度、Kappa系数、RMSE、MAE技术和种子细胞面积指数（SCAI）。工作的主要目的是显示基准模型（即MLP，KLR，RF和MARS）的准确性水平在与混合Meta分类器（bagging）结合后是否增加或减少此外，还涉及检查这些模型在现实条件下的预测有效性如何波动。在研究期间，在大吉岭喜马拉雅山的Kurseong范围内观察到了一场重大的洪水，记录了数百次大大小小的山体滑坡。山体滑坡与图二、研究方法流程图。(MLP1/4多层感知;KLR 1/4核逻辑回归; RF 1/ 4随机森林; MARS1/4多变量自适应回归样条;SCAI 1/4种子细胞面积指数; MAE1/ 4平均绝对误差; RMSE1/ 4均方根误差）。&A.萨哈，S。Saha地球科学中的人工17从而得到了2020年的大洪水，并用于评估所用模型的精度。2. 研究区Kurseong地区（图。 1）覆盖印度大吉岭-喜马拉雅地区380.34km2（北纬26 °46 ° 30 ° N至26°57 ° 47 ° N，东经88°08 ° 25° E至88 °27 °54° E）。Kurseong市海拔1458米，距离大吉岭31.54公里，是一个分区城镇。平均最高温度为23.69℃，平均湿度范围为68%至92%，323.5cm是研究区域的年平均降水量（1982年至2017年的市政天气数据库该地区的气候与Koppen的CWA（季风-亚热带湿润气候）组有关年降水量的85%发生在6月2日至8月底坡度非常陡（40度至69度），整个地区的平均坡度为23.76度。该地区的特点是雕塑退化景观在其年轻阶段的形态下切割的溪流和河流以及地质系统中的既存变形，包括大吉岭片麻岩和大岭山序列的岩石，二叠纪的冈瓦纳岩石，西瓦利克岩石和更新世隆起阶地（GSI，2005-06年近93%的总面积（355.79平方公里）是喜马拉雅山下的山地和50.43%的森林覆盖密集和开放的森林。滑坡经常影响研究区域，并对基础设施和农业造成巨大破坏（图1）。 2）。该地区需要立即部署滑坡缓解规划。对于此类管理策略，滑坡敏感性制图对于确定最易发生滑坡的区域非常重要。3. 材料和方法研究方法主要包括六个阶段：（1）首先，通过对以往文献的研究，选择滑坡的一些条件参数，并从不同的来源收集各种数据(2)在采集滑坡情况后，借助手持GPS进行了一系列野外调查，获得了数据图3. 研究区域的滑坡现场照片（2019-20）（A）Rohini路（26 52 0 23 00N; 88 21 0 01 00 E）;（B）市政道路（26 52 0 28 00N; 88 22 0 29 00 E）（C）NH 55附近（264202 700N;8 82301900E），（D）Kurseong至Darjeel ing市政道路（265203200N，882 001 700E）。A.萨哈，S。Saha地球科学中的人工18.. ..（3）采用多重共线性分析和Relief-F. 第三步，构建LCF的主题层; 采用MLP、KLR、RF和MARS模拟方法对滑坡敏感性进行了模拟（5）杂种MLT（Bagging）是MLP、KLR、RF和MARS的一个集合体（图1）。 2）;（6）下一步，使用AUC-ROC值、MAE、RMSE、错误分类比例、精密度和准确度验证方法对生成的模型进行检验。验证后，用2020年9月的大洪水判断了LSM3.1. Kurseong的滑坡目录图对于任何类型的滑坡建模，必须评估LCF与早期滑坡分布之间的关系（Chen等人， 2016; Saha等人，2022年）。因此，本次研究使用了包含303个历史滑坡的清单图。2016年4月至2020年2月期间，通过全球定位系统（GPS）进行的实地调查，验证了这些滑坡的位置（图3）。此外，亦收集了国家灾害管理局（NDMA）及大吉岭地区办事处先前有关山泥倾泻及灾害报告的资料。清单地图和LCF是以30 m *30 m的标准比例尺绘制的。在收集滑坡数据后，70%的滑坡（212个点）用于运行模型，30%用于测试方法（相当于91个滑坡点）。使用ArcGIS 10.3版的地理统计分析功能来确定训练和测试地点（图1C）。3.2. LSM建模在不同研究者使用的各种因素中选择LCF是一个具有挑战性的过程，因为没有标准化的 Tien Bui等人（2019）和Saha and Saha（2020 a）使用数学方法选择重要的LCF。在所有地区，相同的环境、地质和水文变量并不适用，也不能用于绘制所有灾害的地图（Arabameri等人， 2020年）。为了识别某些地质环境因素，Saha等人（2020）使用了Relief F检验。可以使用不同的分析技术来评估参数，例如相关性、Relief-f、IGF、概率技术和机器学习算法。多重共线性（MC）检验和Relief-F用于识别LCF。3.2.1. 多重共线性（MC）问题的检验MC技术是用于评估变量的程序由于LCF之间的关联性较高，土地敏感性区域的估计可能不准确（Dang等人， 2020; Saha和Saha，2020c）。 MC决定LCF的独立性。 Pearson相关系数、方差百分比、变异系数（VIF）与条件指数的方差和耐受水平可用于测量MC（Cama等人，2016; Sameen等人， 2020年）。VIF和公差过程被应用于估计MC在该区域。用于测量MC的VIF和TOL（公差）阈值为VIF≤5，公差≥0.2（Bui等人， 2016; Saha等人， 2022年）。3.2.2. Relief-F法Relief-F技术被用作另一种因子选择方法。该方法根据因素能力综合权重假设接下来，通过等式（1）测量第i个特征的Relief-F权重RWi。一个随机点可以确定两个最近的相邻点（其中一个是同一类，另一个是不同类）。其中NH是最近的命中，NM是最近的未命中Kononenko（1994）提出了几种Relief-F模型。Ex实验结果还表明，Relief-F的效果等同于初始Relief（Wang等人， 2016年）。3.3. 滑坡条件因子（LCF）不同类型的滑坡（LS）的发生是由于当地因素的阻力和机制的不平衡（Pisano等人， 2017年）。在这项研究中，一些特定的地质环境LCF被选择用于识别LS危险区和制图。本研究最重要的选定因素如下。采用30 × 30 m分辨率的SRTM DEM对LS敏感性进行了评价。它是从美国地质勘探局（www.usgs.org）收集的四个LCF（图 4 A; 4 B; 4C;和4D），包括海拔、坡度、坡向和曲率。年降水量图（图） 4 E）35年（1982https://mausam.imd.gov.in/imd_latest。通常，在滑坡脆弱性分析中，山区的降雨被视为滑坡灾害的重要触发因素（Lin等人，2012年）。排水结构是长期存在的斜坡、地理特征、景观和地形相互作用的自然结果排水密度是通过计算排水的总长度与研究的总面积来测量的（图1）。4 F）。同样，线性构造密度被计算并分为5个分区（图1）。 4G）。高速公路建在一个非常陡峭的斜坡上，破坏了上面的土地保护。地形损失的风险随着区域坡度的增加而增加这项研究将距离道路的距离分为五组（图1）。5H）。土壤特性是衡量滑坡脆弱性的一个非常强大的条件因素（Ozioko和Igwe，2020年）。在该研究区，根据分类学的不同，发现了四种类型的土壤，即WOO 2（壤质骨架土、典型土、壤质骨架土、典型土）、WOO 4（壤质骨架土、典型土、壤质骨架土、典型土）和WOO 6（粗壤质土、翁布里亚土）与土壤有关的两个因素，即土壤类型（图）。 4 I）（表5）和土壤深度（图4L）进行了预处理。土壤类别数据集来自NBSS LUP。&进行了实地研究，以绘制土壤深度图（图4L）。目前的地质图（1：50 000）已重新取样，分辨率为30米。从印度调查研究区的地质图获得。片麻岩、板岩&片岩、达木达、石灰岩和冲积岩是在本研究区域发现的地质段（图1）。4 I）。研究区地貌图（图4 J）摘自Bhuvan（bhuvan.nrsc.gov.in），由ISRO（印度空间研究组织）和矿业部与15个合作机构共同制作。研究领域分为各种中等和狭窄的马刺;山脊，由“V”形成的深谷，以及其他退化特征。LS频率还揭示了与地震活动、断层倾角、坡度方向的关系. Medvedev-Sponheuer-Karnik方法是一种宏观地震强度测量方法，通常称为MSK标度。它的实施是为了评估地震的严重程度，重点是事件对该省的影响。2011年至2018年，该地区发生了5次地震，造成13次滑坡，其中Tista线性地震波造成的破坏更大（表1）。使用监督分类方法制作LULC图。土地利用类型有8类，分别是居民点（7.82%）、人工林（17.13%）、疏林地（26.84%）、农业用地（12.83%）、林地（(4.10%）、沙洲（2.86%）和水体（4.02%）。流功率指数（SPI）（图）。4N），泥沙输运指数（STI）（图。4O），和地形湿度指数（TWI）（图。4P）被认为是制备LSM的重要条件因素（Nsengiyumva等人，2019年）。这些地图是从ArcGIS中的DEM构建的。A.萨哈，S。Saha地球科学中的人工19图四、滑坡条件因素：A。斯洛普湾海拔角Aspect，D.Curvature，E.Rainfall，F.排水密度，G.线性密度，H。路的距离，我。Geology，J.地貌（A深切的入口剥蚀谷;B中等切割的谷;C与断层有关的刻面斜坡; D冲积沉积扇; E切割的屏地斜坡; F低山间谷; G老冲积沉积阶地;H冲积碎屑山间扇; I沉积冲积平原;J河流剥蚀山谷;K山间中等斜坡构造高原; L冲积碎屑沉积新平原），K。&土壤类型，L.土壤深度，M。地震带，N。土地利用/土地覆被，O.SPI，P.STI和Q.TWIA.萨哈，S。Saha地球科学中的人工20¼¼¼图五、滑坡易感性制图由A. MLP模型; B.MLP Bagging模型、C.KLR; D.KLR Bagging模型; E.RF模型; F.RF-Bagging模型; G.MARS模型; H. MARS-Bagging.3.4. 机器学习方法3.4.1. 多层感知通常用于分组的用户熟悉多层感知（MLP）作为ANN（Haykin，2009）。训练集不依赖于输入变量的统计分布假设，这些输入变量的相对重要性没有定义，并且在整个测试过程中根据其权重选择因子（Gardner和Dorling，1998）。输入层、隐藏层和输出层构成并构造MLP。地质环境LCF是输入层和LS或非LS是输出层。隐藏层被分类并帮助将数据传输到输出中。 MLP发展分为两个阶段（Tien Bui等人， 2019年; Zhou等人，2018; Pham等人，2016）：1）从隐藏层传输性能值，然后将结果值与用于区分的先前值合并，以及2）关联相关权重以在最低距离处产生最佳结果。其中X Xi;i1：：：：：：： 18是18个LCF的向量，y 1或0，表示LS或非LS。应用等式（2）进行MLP。A.萨哈，S。Saha地球科学中的人工21×.- 是的Σ1-0p公司简介¼¼表1地震的细节加速了Kurseong地区的滑坡地震日期地震源震级（震中）山泥倾泻数目总伤害18/09/201106/02/2017TistaLineament主边界6.9 MW5.1 MW63相对较高的损害03/01/2017推力（MBT）主中央5.7 MW2损害轻微损坏12/05/2015推力（MCT）普尔奈阿7.7 MW1建筑12/09/2018珠穆朗玛峰线形（PEL）Saptegram，5.3 MW1损坏轻微损坏阿萨姆资料来源：中国政府地球科学部国家地震中心印度;报纸- Hindustantimes Indiatoday&（2）第一次见面其中，F（X）被假设为一个隐藏的机制，在网络架构训练过程中通过可修改的权重进行。在我们的研究中，为了防止过度拟合，使用MLP拟合了1个隐藏层，500个epoch和20个通过试错获得的验证阈值。3.4.2. 核逻辑回归（KLR）KLR是一种有效且可扩展的判别方法，可以具有良好的类别预测（Sugiyama和Simm，2010）。Mercer核提出了一种内置于高维特征空间的传统逻辑回归模型（Mercer，1909）。给定标记的训练信息，需要执行以下操作：（3）（1）（2）（3）（2）（ 3）（2）（3）（式中，滑坡条件系数用xi表示，函数空间，K：X X→R计算输入向量值的核函数在本研究中使用各向同性径向基函数（RBF）作为Kx;x1¼（ 4 ）第一章：一个人的世界（4）然后，在特征空间中，建立标准逻辑回归模型，如下所示：由B，T和A（Chan和Paelinckx，2008）。 Chen等人（2016）确定了使用“OOB”误差和评估过程的优点：没有过度拟合误差、低偏差和方差、个体树之间的有限关联、严格的误差估计和出色的预测性能。Afanador等人（2016）还为RF模型准备了函数算法。在该分析中，使用Rstudio的“randomForest”软件包进行RF建模（Mackier等人， 2010年）。BTAlogN（6）3.4.4. 多元自适应回归样条Friedman和Roosen（1995）是第一个引入MARS的人以类似于最小二乘回归的方式，它调查了研究的两个变量之间的联系（Wang等人，2021年）。MARS 0的优势包括其数值有效性、生成简单易懂模型的能力以及衡量预测变量贡献的能力。然而，最显著的缺点之一是它不能准确地预测（Nguyen等人， 2021; Wang等人， 2021年）。为了解决这个问题，将bagging应用于MARS，产生了MARS-Bag，这提高了分类准确性。3.4.5. MLP、KLR、RF和MARS的装袋由Breiman（1996）引入的Bagging被指定用于预测LS敏感性，这是一种适当且有效的集成技术。为了指导单个分类器，Bagging过程使用引导样本。MLP、KLR、RF和MARS训练数据的新子集通过随机抽样替换训练集来收集。作为训练基础分类器，包含了某些子训练集。为了纳入基本分类器的结果，使用了多数投票（Breiman 1996）。作为Bagging集合Meta分类器的基础分类器，MLP、KLR、RF和MARS MLT用于将结果与单个MLP和RF模型进行比较。3.5. 验证计算过程如果要计算模型的可靠性，则验证很重要（ Groesser 和Schwaninger ， 2012; Saha 等人， 2020 年）。使用两种统计方法（MAE和RMSE）和三种阈值依赖性统计（ROC曲线下面积、错误分类比例、准确度和精密度）来确定本分析中模型的可靠性3.5.1. 阈值依赖法ROC用于评估敏感区的技术需要logitfhxlogit g ¼ω：φx þlogitlogit¼logP其中，最佳模型参数由ω：cω表示。3.4.3. 随机森林（RF）（五）检查（Meng等人，2016年）。在这里，一个以上的验证过程被应用于判断预测能力，它是更容易接受的所有支持模型。这些文献确保ROC的AUC是用于模型验证和比较的有用方法（Marjan ov ic，201 3;Gayen等人， 2019）。AUC计算采用等式（7）。RF是一种基本的机器学习过程，其产生准确的预测而没有维数灾难（Shahbazi等人， 2017年）。RF模型基于分类树的概念RF可靠地比较、测试和处理各种环境中的不一致性和不精确性AUC拉克什卡ðPþNÞ（七）数据集（Lin等人， 2015年）。 RF模型创建了一系列决策树，其中基尼指数平均下降（Cutler等人，2007年）的报告。在每个分支节点处，RF模型考虑输入数据的随机子集，并且允许树生长而不限制树的最大大小（Rodriguez-Galiano等人，2012年）。RF从装袋过程开始，在装袋过程中随机选择自举子样本检查未使用的子样品，以评估其中a是D是假阴性。P是“非LS的总数”。产品编号a（8）拉瓜阿贝什或OOB都考虑在内。首先测量每个OOB误差调整模式的效用。稳定性被认为是准确度表a 拉克什拉瓜 þB þC 拉法（九）通过随机装袋过程证实（Breiman，1996）。BT A log（N），其分别包括所表示的每个划分中的训练样本（训练组LS出现）、树和节点的数量AUC值的范围为0至1，最接近1.0的值意味着模型的效率更高。预测分析的可靠性及其可靠性也使用错误分类的比例进行了测试A.萨哈，S。Saha地球科学中的人工22Xi¼-¼¼¼ja-b准确度和精确度。更高的准确度和精确度值表明该模型具有更高的可预测性。另一方面，较低的值比例被错误地分类表明更高的精度。3.5.2. 统计技术MAE RMSE&在此分析中使用MAE和RMSE来检验模型。预测值和实际值之间的一些差异称为MAE。MAE的平方根用RMSE表示对于MAE和RMSE估计，使用公式（7）和（8）：nMAE ab（10）ni¼1siXnn1/10.982和2.869（表2）。结果表明，本研究选取的18个LS条件因子是建立LS敏感性模型的理想因子。4.2. 分析Relief-F为了获得更好的性能和准确的项目敏感度，有必要选择合适的LCFRelief-F （ RelF ）方法被认为是一种有效的属性选择技术（KutlugSahin和Colkesen，2019; Saha等人， 2020年）。RelF用于计算不同因素的平均价值（AM）AM越高的LS影响因子对LS磁化率建模越重要。具有“0“或负AM的因子对于LS磁化率建模不太重要。根据AM法，所选因子均具有较好的诱导能力，研究区的滑坡（表3）。其中，n是“训练或测试样本集的样本大小”; a是“预测值”，b是“实际值”。Willmott和Matsuura（2005）使用了这一策略，并确定了0.5的限值。超过0.5的值表明模型的结果较差这两个测试用于确定滑坡敏感性模型的有效性（Roy和Saha，2021年; Saha等人， 2021年）。3.5.3. 种子细胞面积指数Suzen和Doyuran于2004年推出了SCAI 它计算了LS在不同LS敏感性类别中的百分比。在非常好的模型的情况下，SCAI值在非常高的LS敏感性类别中是最高的（Roy等人，2019年）。SCAI按照公式12计算SCAI阿尔（12）ATV其中，Ar是敏感性类别的面积扩展，以百分比表示，Atv是训练和验证数据集的百分比。4. 结果和讨论4.1. 多重共线性检验结果TOL和VIF表明LS条件变量之间不存在多重共线性困难（Sameen和Pradhan，2019;Saha和Saha，2020 c）。根据多重共线性检验（表2），降雨的最低TOL为0.318此外，土壤类型的最大TOL为0.914。本研究中的最低和最高VIF值分别为表2滑坡形成条件的多重共线性分析滑坡条件因子共线性统计4.3. 滑坡敏感性图（LSM）这八个LSM是在GIS环境中使用MLP、KLR、RF 、MARS、MLP-Bagging、KLR-Bagging 、RF-Bagging和MARS Bagging模型，考虑70%的滑坡数据集创建的（图1）。 5）。不同模型的面积分布见表4。根据模型的结果显示，MLP 、KLR、RF 、MARS 、MLP-Bagging、KRL-Bagging、RF-Bagging和MARS-Bagging模型中LS敏感性极低的区域分别为76.64（20.05%）、84.31（20.00%）、84.00%（20.00%sq.kmsq.km （ 22.05% ） 99.70 平方公里（ 26.08% ）， 103.54 平方公里（27.08%），99.71sq.km （ 26.06% ）， 84.31sq.km （ 22.05% ）， 115.12 平方公里（30.11%），以及99.94 sq.km（26.14%）和中度LS可疑易感级分别为75.74 sq.km（19.81%）; 85.91 sq.km（22.47%）; 73.91 sq.km（19.33%）; 79.93sq.km（18.83%）; 66.95sq.km（17.51%）; 91.46 sq.km（23.92%）;73.91 sq.km（19.33%）和71.99平方公里（18.83%）。LS敏感性相对较高的区域在KLR 中为49.90sq.km （ 13.05% ），在MARS-Bagging中为46.87平方公里（12.26%）;在RF中为45.57（11.92%），在RF-Bagging中为37.77平方公里（10.14%）。 5）。根据滑坡敏感性模型，研究区的中部和西部地区非常容易发生滑坡。4.4. 使用ROC曲线进行评估用于滑坡敏感性分区的模型的合理性至关重要，因为这些模型在未经验证的情况下不会产生任何后果（Arabameri等人， 2020）; Sahaand Saha，2020a）. 采用ROC、准确度、精密度、误分率和SCAI指数等指标对Kurseong地区LS易感性作图进行本研究验证了应用于滑坡敏感性的四个MLT的输出，并结合了从表3滑坡制约因素的Relief F结果容忍VIP所选因素值（Relief F方法）斜率0.8731.279地貌0.05913高程0.4352.780河网密度0.03879方面0.6411.094线性密度0.03505曲率0.7481.143道路密度0.03319降雨0.3182.869地质0.02949河网密度0.7151.874斜率0.02705线性密度0.7871.465海拔0.02425距离道路0.9081.108LULC0.01894土壤类型0.9141.082土壤深度0.01863土壤深度0.8751.113土壤类型0.01819地质0.7641.265降雨0.01711地貌0.8211.189方面0.01131震区0.3982.184Twi0.00734土地利用/土地覆盖（LU/LC）0.8731.153震区0.00525Twi0.9061.107曲率0.00222STI0.7451.350SPI0.00199SPI0.6921.448STI0.00185RMSE¼（十一）A.萨哈，S。Saha地球科学中的人工23如上文所述的现场工作此外，测定AUC以比较模型的效果（图13）。（六）。ROC曲线的拟合结果表明，各模型对滑坡易发性的预测具有较大的潜力。 MLP、 MLP Bagging 、 KLR 、 KLR Bagging 、 RF 、 RF-Bagging、MARS和MARS-Bagging模型的AUC-ROC值分别为84.57%、90.37%、83.76%、88.05%、88.10%、92.28%和84.17%&验证数据集和训练数据集的AUC-ROC 值分别为82.95%、88.75%、81.98%、85.53%、87.89%、90.85%和82.78%，&86.66%（表5）。因此，结果表明，MLP，KLR，FR和MARS模型在集成装袋后的性能提高了约2-3%，用于绘制Kurseong-Himalayan山脉的滑坡易感性。（图6）。RF-Bagging方法达到了最高的准确度，其次分别是MLP- Bagging、RF和MLP（表5）。首先，RF- Bagging模型实现了最低比例的错误分类， MAE 和 RMSE 值，其次分别是 MLP-Bagging，RF和MLP。与其他具有潜在混杂因素的滑坡敏感性建模模型相比，RF Bagging技术被证明是最高的。4.5. SCAI模型性能验证用于验证模型的另一种方法是SCAI。SCAI验证方法在一些当前LS研究中的LS建模精度计算中实现（Khari等人， 2019; Saha和Saha，2020 c）。Suzen和Doyuran在2004年创建了这个过程表6给出了MLP、MLP-袋式、RF和RF-袋式模型的SCAI值。从极低到非常高的级别，SCAI值为一个合适的模型增加。因此，SCAI值也证明了MLP-Bagging模型优于MLP模型，RF-Bagging模型优于RF模型。这也证明了所有模型都有很好的能力来映射LS磁化率在该研究区。5. 讨论5.1. 模型预测性能比较有几种方法用于确定对环境的风险。然而，建模机制和方法是多种多样的，并提供了具体的结果和预测输出。使用各种方法的基于GIS的地理预测是环境和空间环境研究的基本工具，可以帮助管理环境问题（Nasiri等人，2014; Lombardo等人，2020年）。获得一系列解决方案大大提高了决策者确保环境发展连续性的意愿（Liu等人， 2008年）。 Saupe等人（2012）警告说，建模方法的应用将在许多其他领域或其他应用中产生完全不同的结果和非常不同的产出。为此，模拟结果评估对于模型效率和准确性评估至关重要（Briand等人， 2000; Stoyanov等人，2013年）。在该分析中，使用AUC-ROC、精密度、准确度、错误识别比例、MAE、RMSE和SCAI比较了预测LS易感性的模型的预测效率。八种型号（MLP、KLR、RF、MARS、MLP-装袋、KLR-装袋、RF-装袋和MARS-装袋）的性能各不相同。所有的模型都表现出令人难以置信的性能以及RF袋集成模型被证明是合适的方法进行预测。 Pham等人（2016）还使用MLP作为印度GarhwalHi-malayan的LSM合奏的基础分类器。 Azhari等人（2020）在天体物理学领域使用了基于装袋的ANN模型。Salam和Islam（2020年）在孟加拉国使用RF-bagging计算蒸散量预测研究具体的因变量用于预测LS敏感性，包括地形（坡度、海拔、形状和曲率）、地貌（排水密度、SPI、TWI）、土壤（类型和深度）、地形和人为行为（LULC、道路距离）。本分析中的LSM的主要指标是坡度、降雨量、地貌和海拔。表4MLP、KLR、RF、MARS、MLP-Bagging、KLR-Bagging、RF-Bagging和 MARS-Bagging模型用于滑坡敏感性等级的区域分布。模型滑坡敏感性等级非常低低中等高非常高MLP-装袋sq.km中的区域99.71130.5766.9541.45MLPsq.km中的区域76.66138.2275.7450.97KLR装袋sq.km中的区域99.71107.6391.4644.5KLRsq.km中的区域84.31107.6385.9154.6RF-装袋sq.km中的区域115.12105.1873.9149.36RFsq.km中的区域130.310347.3356.13MARS-装袋sq.km中的区域99.94110.3171.9953.18火星sq.km中的区域103.5469.9398.4159.8面积%26.0834.1517.5110.8411.42面积%20.0536.1519.8113.3310.66面积%26.0828.1523.9211.6410.21面积%22.0528.1522.4714.2813.05面积%30.1127.5119.3312.9110.14面积%34.0826.9412.3814.6811.92面积%26.1428.8518.8313.9112.26面积%27.0818.2925.7415.6413.25A.萨哈，S。Saha地球科学中的人工24¼¼¼ ¼¼¼ ¼¼见图6。滑坡模型验证：A.使用训练数据集的个体机器学习模型的ROC曲线，B.集成机器学习技术使用训练数据集的ROC曲线，以及C。使用测试数据集，D.集成机器学习技术在测试数据集上的ROC曲线。表5ROC、精密度、准确度、错误分类比例、MAE和RMSE方法的值数据集模型精度精度比例对一切MaeRMSE错误分类AUC（%）培训MLP0.8040.8150.20

下载后可阅读完整内容，剩余1页未读，立即下载