没有合适的资源?快使用搜索试试~ 我知道了~
阵列15(2022)100187统计建模和机器学习如何帮助校准数值模拟和流体力学模型?架空线导线振动特性模型的校准应用Hamdi Amrouna,Hamdi,Fikri Haupirb,c,d,Ammi Mehdiaa法国圣但尼巴黎第八大学LIASD实验室计算机科学、人工智能系bRTE-R D:7C place du Dome,92800 Puteaux,France,cMSDA UM6P(Lot 660,Hay Moulay Rachid,Ben Guerir 43150,MoroccodENS Paris-Saclay 4,avenue des Sciences 91190 Gif-sur-Yvette,法国A R T I C L E I N F O保留字:机器学习数值模拟流体力学模型标定架空线导线A B S T R A C T由于使用数值模拟技术,流体力学世界越来越多地产生大量数据。这为结合机器学习方法来解决模型校准等数据相关问题提供了有趣的机会。机器学习可以为工程和流体力学领域提供的应用之一,特别是模型的校准,使其能够近似一种现象。事实上,一些流体力学模型产生的计算成本促使科学家使用接近原始模型但计算强度较低的其他模型,以便于处理。在所使用的不同方法中:机器学习与一些优化方法和算法相结合,以减少所引起的计算成本。本文在分析了现有文献资料的基础上,提出了一种新的灵活的、优化的和改进的方法来校准被称为尾流振荡器(WO)的物理模型的框架,该物理模型模拟架空线导体的振动行为。一个被称为切片理论(ST)模型的沉重而复杂的模型的近似。OPTI-ENS由集成机器学习算法(ENS)和WO模型的优化算法,WO模型可以生成足够的训练数据作为ENS模型的输入。因此,ENS型号将将来自WO模型的数据作为输入,并将来自ST模型的数据作为输出。作为基准,一系列机器学习模型已经实现和测试。保留OPTI-ENS算法,最佳决定系数(R2评分)接近0.7,均方根误差(RMSE)为7.57e−09。此外,该模型比没有优化WO模型生成训练数据的ENS模型快大约170倍(在计算时间方面)。因此,这种方法使得有可能校准WO模型,以便架空线路导体的行为的模拟仅使用WO模型进行1. 介绍架空线路操作员易受环境相互作用的影响,特别是那些因与风速不同而产生的相互作用。例如,风的运动会产生振动,这些振动会造成问题,并对这些导体和物理资产的老化产生影响。在意识到这一问题后,法国TSO(输电系统运营商)Rte(Réseau de Transport d'Electricité)的研究团队(风速等)。这项研究导致了两种类型的模型的发展,使得有可能在给定的风速下在时间和空间上有给定导体的运动[1]。 第一个物理模型,称为条带理论模型(ST),基于计算流体动力学计算(CFD), 这 是计算时间昂贵,处理工作量大(商业软件、输出控制、存储等)。第二种模型,称为尾流振荡器模型(WO)。这个模型是在一个特别的工具中实现的,基于耦合项的简化,避免了所有∗ 通讯作者。电子邮件地址:amroun@math.univ-paris13.fr(H. Amroun),fikri. rte-france.com(F. Haidian),mehdi. univ-paris8.fr(A.Mehdi)。https://doi.org/10.1016/j.array.2022.100187接收日期:2022年2月3日;接收日期:2022年5月10日;接受日期:2022年5月11日2022年5月30日在线提供2590-0056/© 2023由Elsevier Inc.发布这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可在ScienceDirect上获得目录列表阵列期刊主页:www.elsevier.com/locate/arrayH. Amroun等人阵列15(2022)1001872Fig. 1. 项目流程图与第一物理模型相关的笨重使用简化的尾流振荡器模型涉及建模参数的选择(即"超参数”),其通过基准结果(条带理论模型结果)校准。因此,通过比较两个模型提供的输出结果来完成这种模型的校准,知道这里我们将切片理论模型作为再现的参考。这个步骤的问题是,如果没有适当的优化,它可能会被证明是昂贵的模拟次数到目前为止,Rte对该主题的研究很少涉及这一点在学术上,机器学习模型在许多领域带来的革命,特别是在流体力学和工程领域,已经改变了物理学家和研究人员的做法和方式。 这个领域的一个问题。事实上,这些不同的数值建模和科学计算方法产生了大量的数据,必须定期分析和综合这些数据,以便能够处理它们,从而产生见解。在这种情况下,特别是在流体力学的数值模拟领域,最近在文献中已经建立了结合物理和ML方法的不同策略,以便将近似或简化模型与所考虑的某个模型相匹配。如何成为一名裁判[1这里包含的机器学习算法将需要额外的工作,以便在可接受的时间内获得结果。事实上,这里使用的尾流振荡器模型需要优化,以避免对同一时间序列运行多次。因此,这是一个提供技术的问题,不仅可以减轻WO的计算,但也不必通过结合用于优化WO模型的方法来手动进行。 因此,优化模型的结合将使得有可能生成ENS模型将恢复的训练的“良好数据进行训练并预测y/d值(电缆的性能)从而避免了对手动生成训练数据的无休止等待[4(see 图①的人。本文的目的是提出一种新的策略,使用ML与优化算法相结合来校准超参数 尾流振荡器模型的模拟从条理论模型。该想法是允许WO模型由于使用机器学习模型而自适应,该机器学习模型将WO的数据作为输入并将产生相应的预测作为输出,即ST模型数据。最后,WO模型将能够产生预期的输出,而无需手动校准,以及在可接受的时间。这里的想法不仅是产生可以用ST模型和WO模型获得的数据,而且还能够以自动和快速的方式进行,同时保证更好的近似结果。为了实现这一点,我们提出了一个处理管道,包括三个阶段:(i)数据收集,(ii)数据建模和(iii)数据可视化。第一步是通过运行WO模型来收集必要的数据,以构建机器学习模型。在这里,我们将使用几种优化算法来找到WO参数的最佳值并构建训练/ 测试/ 验证集。HyperOpt优化算法将在这里享有特权,因为它适用于我们的多参数和多维问题。然后,我们将提出一种方法,允许建立我们的ENS模型。最后,为了进行比较,将测试一系列模型,以便将它们与我们的模型进行比较并选择最佳模型在本文中,我们探索了一种基于使用集成学习方法(ENS)的方法,该方法结合了优化算法来校准WO模型,以便它可以用于近似ST模型。我们的方法分为三个阶段:第一步是收集将用于构建ENS模型的数据。数据收集需要使用WO模型,使用超参数的正确值,以便具有代表问题的数据,即接近ST模型。第二步包括H. Amroun等人阵列15(2022)1001873图二. OPTI-ENS框架。建模:由此生成的数据将用于构建ENS模型。第三步是评估使用未参与其设计的数据构建的模型。本文的其余部分组织如下:第3节介绍了校准此预测模型的方法。第4节介绍了本研究的结果。第5节对这些结果进行了讨论,最后我们得出了结论和展望作为参考。2. 方法图3总结了我们的方法的框架。在这一部分中,我们提出了我们的方法,使我们能够最佳地预测架空线路导体的振动行为。 我们的方法由两个主要步骤组成:(i)通过WO模型收集数据,以及(ii)构建机器学习模型,允许将WO数据作为输入并预测y/d输出值。理论基础 ST模型及其WO近似在以前的工作中已经讨论过[40]。在这项工作中,这是一个问题,定义的WO和ST模型的理论框架。第一次尝试预测值的y/d从这个WO模型已经建立。 在本文中,更多的是关于改进我们以前已经做的工作。前面提到的限制之一是达到和建立训练数据库的计算量很大。第二个限制是能够在本地运行学习模型,这促使我们将其分发到云中。在下文中,这一方法部分将主要包括两个阶段:(i)第一阶段是纳入一个优化来自工作订单的数据收集的模型。(ii)第二步在于训练机器学习模型,使得可以预测y/d的值。这里提出的框架被称为OPTI-ENS。OPTI指的是训练数据收集阶段中包含的优化算法,ENS指的是我们的训练模型(Entrance模型)。2.1. 用于尾流振荡器模型校准的OPTI-ENS模型我们通过说它是关于开发允许从ST模型的数据校准WO模型的优化方法来启动该方法。这种近似只有通过使用WO模型的超参数值才有可能。这引起了问题,特别是麻烦的处理和难以找到最佳值。事实上,单个数据配置(来自ST模型的时间序列)将需要执行数百次WO模型,每次执行将需要2分钟到40分钟,具体取决于时间序列的长度以及我们选择进行模拟的机器类型。因此,有必要对模拟和数据恢复进行优化(见图1)。 2)。我们在这里提出了一个框架,允许自动和优化收集的数据,允许校准的唤醒振荡器模型,以创建训练模型,然后预测y/d的值。处理管道由三个阶段组成:(i)使用Wake Oscillator模型收集数据,(ii)通过Hyperopt模型生成数据,以及(iii)构建ENS预测模型以预测y/d值。2.1.1. 优化数据收集过程在这项研究中,我们的OPTI-ENS模型直接对时间序列WO数据进行操作,以预测y/d的值WO数据可以从WO模型的执行中获得,遵循其超参数的不同值。我们的数据集由以下元素组成:10个变量,包括模型的超参数的不同值,即(md,U[m/s],d[m],m[kg/m],L[m],H[N],Nt,Dt[s],tf[s],ymax[m])和y/d值。y/d的值是使用WO模型计算的值图图12、图13和图14示出了根据超参数的值的两个模型(W 0和ST)的y/d的值的概览。调整这些值可以改善两个模型之间的近似,如图 所示。 13和14.超参数的微调使得可以实现如图14所示的最佳配置。这是一个来自数据库的单一时间序列的例子。这包括总共60个时间序列。这代表了近5620秒的总记录。我们需要一个合适的度量来比较两个时间序列。其中一个广泛使用的度量是RMSE度量。这种方法需要有两个相同长度的时间序列,即具有相同数量的点。为了获得时间序列, 相同的数字,我们对参考模型应用变换,基于时间步长(dt)和输出步长(dr)的定义,WO模型的最终时间和总点数。������(���������������������������)=������∕������(1)���该公式使得可以获得具有与WO模型相同的点数这随后允许使用方法来比较2个时间序列,包括RMSE。既然数据已经预处理完毕,下一步将讨论建模。尽管该方法是有效的,但使用这样的学习框架将导致灵活性的问题。 实际上,学习管道将始终以手动生成的WO的数据为基础。为了减轻和改善这种方法,一种优化WO数据生成的方法已经实现。对不同优化方法的研究已经在最先进的技术中广泛使用,特别是对于运筹学社区,这促使我们探索其中之一,即HyperOpt。在我们的例子中,搜索空间是WO模型及其各自的取值范围。Hyperopt提供的优点之一是可以根据特定分布(例如根据均匀分布或对数正态分布)定义值的范围,同时定义某些参数的离散值和其他参数的浮动值的分布。H. Amroun等人阵列15(2022)1001874见图4。 Hyperopt算法。图三. Hyperopt参数。TPE算法基于该算法在Hyperopt迭代过程中建立的搜索历史。该历史由在参数的一侧上组成的元组组成,并且在另一侧上由成本函数获得的输出组成。 首先,TPE根据目标函数获得的值对元组进行排序,然后将它们分成2组。随后,TPE通过核应用估计,使得可以获得2个集合中的参数的所谓密度概率。最后,我们恢复的最小值之间的比率2集。所获得的参数组合存储在搜索历史中并传递给成本函数。因此,我们创建了一个搜索空间,Hyperopt算法可以探索。然而,我们遇到了与RAM消耗呈指数级增长有关的困难。这是由于生成的模拟在RAM中累积以及pp参数设置为“True "使得 执行控制台上的结果使编程工具过载。在将模拟用于计算之后,系统地抑制模拟,以及将pp参数定义为“False”,使得解决这个问题成为可能。然后,我们将Hyperopt算法应用于我们的时间序列。为此,我们使用了从10到550的迭代,参数搜索范围的变化,以及使用Tree-Parzen建议和模拟退火算法。使用这种参数配置,我们没有成功地获得足以整合到训练集中的结果。此外,Hyperopt算法的执行时间不允许执行更多的迭代来优化结果。在我们列出的可利用的优化方法中,基于模拟退火的方法(图1)。(八)。因此,我们尝试使用这种算法以优化WO模型的参数[41]。模拟退火是一种受金属冷却启发的算法。其原理在于定义起始温度值, 温度下降速率,以及温度能够达到的最低限度。该算法首先选择一个初始点,并使用成本函数评估相邻点如果搜索空间也接受另一个搜索空间中的嵌套搜索空间。建议算法是Hyperopt算法的核心。它可以通过建议传递给目标函数的有希望参数的组合来评估搜索空间的哪一部分是有希望的。建议算法主要采用树-Parzen估计(TPE).最后,求值次数用于定义目标函数将被求值的次数。评估的数量越多,算法可以探索的值的范围越多,以找到参数的最佳组合(见图11)。4)。一般操作基于建议算法,该建议算法评估搜索空间,以便优化对可能感兴趣的参数子范围的搜索。然后,这些参数作为输入提供给成本函数,输出必须最小化。该算法将获得的最佳结果保存在内存中。如果相邻点优于当前点,则算法将其作为最佳结果保存在内存中。 算法的核心基于相邻点比当前点差的情况。在以下情况下,根据随温度值而减小的接受概率,结果总是有可能被接受。在每次迭代中,温度根据降低速率降低。这个系统,叫做Metropolis准则[42],首先使探索结果成为可能,因为对于高温,接受的概率很高随后,随着温度的降低,接受的概率降低,允许在最有希望的区域中利用结果。模拟退火的WO模型的应用程序并没有得到有趣的结果。所发现的参数波动很大,没有收敛的迹象。然而,模拟退火的一个更强大的变体,称为双退火,似乎提供了更高的鲁棒性相比,模拟退火。这种方法是基于2个版本的模拟退火的组合,通过结合经典版本的模拟退火,H. Amroun等人阵列15(2022)1001875[]������()���������()下一页[客户端]⎢⋅⎣⎦⋅⎥图五、 Hyperopt结果与1-R2评分成本函数。退火与“快速"的版本,允许选择的参数进行探索的方法的变化的概率结果验收和改进的降温方法。因此,我们尝试应用双重退火算法来优化我们模拟器的参数所获得的结果显然比通过简单的模拟退火获得的结果更有趣,但并不比通过Hyperopt获得的结果更好。此外,执行时间这种方法的复杂性使得很难执行许多必要的迭代以评估我们用例中算法的准确性,并使 在这些迭代范围上使用Hyperopt在结果方面更有趣。由于Hyperopt运行在有限的迭代次数内无法提供可操作的结果,因此我们决定将运行迁移到分布式实例。该实例具有更大的计算资源,可以更快地执行计算,从而使用Hyperopt算法进行比本地机器上的执行更多的迭代次数。此项目选择的架构是带有分布式ml.c4.2xlarge实例的AWS Sagemaker。在这个实例中 使 用 的 代 码 是从Github加 载 的 (图1和图2)。8和9)。2.1.2. OPTI-ENS型号我们的OPTi-ENS模型由两块砖组成:Hyperopt型优化算法,然后是学习算法。因此,由于在WO模型上使用Hyperopt,生成了训练数据。在这个阶段,我们已经准备好用这些训练数据来训练我们的ENS模型。我们的ENS模型的技术架构由10个XGboost类型模型(形成XGboost钻)和一个深度神经网络(DNN)组成。所有XGboost和DNN模型都将WO模型的数据作为输入,即y/d值以及WO模型的超参数值,这使得可以获得这些y/d值。这些模型分别生成预测,作为元数据来为岭回归模型提供数据。因此,OPTI-ENS模型的最终输出采用所有模型(XGboost和DNN)的所有输出的加权平均值的形式。对于给定的输入数据集n=n1,n2,������ ��� ,=���11,12...���在此基础上,我们定义了一个函数,根据WO超参数值来预测ST模型在时间t+ 1处的y/d。它可以给出如下:到目前为止,Hyperopt算法使用RMSE成本函数。我们尝试使用基于R2得分的成本函数。R2评分是用于评估两组数据之间的结果的离散度的度量。负结果表示回归不如直线好,零结果表示明显差异,接近1的结果表示2条曲线之间的相似性。由于Hyperopt只需要函数最小化而不是最大化,我们选择定义一个由公式定义的成本函数������������������������(���̂���+1=���(���)���=������1,���2,���������其中,预测y/d表示预测y/d,��� 表示所提出的ENS模型的功能,该模型是XGBoost和DNN模型的组合,如下所示:������������������(���������其中,x1(x1),x2(x2).,x3(x4)表示x4 XGBoost模型(即在������������������������这些基本模型被训练以预测y/d,如下所示:将该成本函数应用于Hyperopt,可以显著提高所获得结果的质量。所得到的结果在视觉上比用RMSE代价函数得到的结果有趣得多。它还有助于建立一个更���1=���������̂2 =���2(���)⎢ ⎥(五)这是一个数学上可靠的度量,用于评估时间序列之间的相似性,到目前为止,主要是根据它们的视觉趋势和外观进行评估(见图1)。5)。选择的优化方法,Hyperopt将提供训练数据来训练管道,以预测y/d的值。在下一节中,我们提出了一种新的方法来预测ST数据的最佳精度。���̂���+1 =������+1(���)其中,y/d是由各个基本模型(即XGboost和DNN)预测的y/d。这些基础模型的输出作为岭回归的输入,岭回归为每个基础模型分配权重,以给出最终的y/d预测,如下所述���̂ =���0+���1 ∗��� 1 +���2 ∗��� 2 +⋯ ⋯+������+1 ∗��� ���+1(6)⎡⎤H. Amroun等人阵列15(2022)1001876[]������()下一页∑(2���()下一页������在我们的DNN模型中使用了ReLU,ReLU最小值 = 0���Max在本节中,我们将介绍模型的微调方法。这个过程是模型质量的唯一保证������,���+∑���������,���, ℎ���������,���其中,xGboost表示分配给每个基础模型(XGboost和DNN)的权重。���使用实际y/d和预测y/d之间的差值的平方来优化这些权重,如下所示:ReLu的另一个值写为:f(y)= min(max−1,max(min+1,))(9)���������其中,R2和R3是ReLu的常数值在������������������(=1=1(七)最小值+1最大值−1没有���。其中,C(k)是用于优化岭回归模型权重的函数,而y/d是实际的y/d。每个XGBoost子模型都使用80%的随机选择的训练数据进行训练,以确保数据和每个模型都在单独的超参数上进行训练。添加了回归岭模型,以便独立地整合每个子模型的y/d值的每个预测结果。文献表明,为了确定模型的泛化性能,我们的数据集被分为三个子集:训练集、验证集和测试集,分别占总数据的80%、10%和10%。- 训练集用于训练和构建子模型XGBoost和DNN。- 验证集用于确定不同子模型架构的性能(XGBoost中回归树的数量,DNN架构的隐藏层和单元或神经元的数量)。- 测试集通过均方根误差(RMSE)和平均偏差误差(MBE)的平均值来确定泛化的错误率。2.1.3. 实施我们的方法其本身,并且没有关于仿真时间序列数据的任何领域特定知识。通过跳过提取特征的过程,模型可以变得更具响应性。训练过程分为两个步骤:预训练和微调。预训练是无监督的,并且将使用贪婪逐层训练算法获得初始网络。 微调是有监督的,所有层的参数将使用反向传播算法更新。以下符号用于表示网络的组件- ���������������= ℎ0 Input layer.������-(i = 1,2,���������- O =输出层。���- ������(i = 1,���������������������- ������(i = 1,���������������������- ������(i = 1,���������������- :所有网络设置- Tr:training dataset -���():参数网络中与标签相关的分数������。- 根据[15],对于两个相邻的层:n���-(1和n-���������activatio)n函数被定义为pn���-1,���=1n-1��������� 为���它的泛化能力和鲁棒性,根据文献,仍然是定义的重要元素,特别是在为流体等领域创建机器学习模型p(电子邮件)���,= 1���−1������)=(������,���+,������,1(1+ e−x)(十)力学(a)企业简介我们首先解决和解释最佳XGboost模型结构的基础。首先使用网格搜索技术在验证集上评估单个XGboost模型。这种网格搜索技术必须找到两个参数之间的最佳组合(a) 回归树的数量(XGBoost)(n-估计量,n)和(b)回归树的最大深度(n)。一组XGBoost模型用于构建XGBoost森林。通过评估验证集中的模型,(b) 深度神经网络利用Tensorflow库构建的该模型的结构包括:(a)输入层,考虑WO模型的超参数的不同值,y/d的值作为函数 (b)具有多个神经元并具有作为激活函数的“Relu "函数的多个单独的层,以及最后(c)具有表示具有线性激活函数的y/d的值的单个神经元的输出层。隐藏层的数量计算如下:我们从单个隐藏层开始,epoch的数量从120到380不等,步长为10。然后逐渐增加更多的隐藏层,并分别在训练集、测试集和验证集中计算RMSE值。我们得到了8个隐藏层,它们在RMSE方面产生了最好的结果。在此步骤之后,模型进入过拟合阶段。为此,在网络中添加了dropout层作为正则化方法,防止过拟合,提高泛化性能。我们使用的模型的特殊性是,当在选择和决策过程中调用DNN模型时,可以实现更好的预测能力。事实上,我们在这里引入一个标准,允许通过在两个极限之间修改其激活函数ReLU来增加神经元的数量如下所示f(y)= max 最小值+1,最小值(8)其中,Rmin是DNN中的新ReLu的常数值���min−1= 0,而���凡(.)是逻辑函数。DNN模型的训练分为两部分:预训练和微调。所有的实现都是在SageMaker下的AWS环境中,在p4d.24xlarge类型的实例下在下一部分(结果)中,我们还将我们的结果与其他竞争模型(随机森林,线性回归,Adaboost,SVR,XGboost,DNN)的结果进行了比较。 对于我们测试的DNN模型,具有单个隐藏层的神经网络类型模型,表示数据的输入层和具有表示预测值y/d的单个神经元的输出层(参见图11)。(六)。3. 结果在本节中,我们将根据不同的机器学习模型以及我们的OPTI-ENS模型来展示y/d值的不同预测结果。该基准主要涉及RMSE类型错误和R2得分,因为这两个度量是最重要的,通常在现有技术中广泛使用,特别是在回归或分类中的机器学习模型的验证中。本节分为两个部分:(i)Hyperopt优化算法生成的数据的可视化,这些数据是训练数据;(ii)ENS模型的创建和训练,该模型由几个XGBoost模型和一个通过修改其ReLu激活函数优化的DNN模型组成。 最后,我们还将提供预测结果,RMSE误差,执行速度的差异以及我们在构建OPTI-ENS模型过程3.1. 数据可视化训练集的创建需要使用模型WO以便将模型ST的数据与模型WO的数据相匹配。 图图13、14和15使得可以可视化与ST模型相比,WO模型的数据的模拟数据的单个时间序列。注意,通过更改���(x)=我们的DNN被用作回归器,它可以提取特征 通过H. Amroun等人阵列15(2022)1001877见图6。 建议ENS模型的架构。见图7。 仿真数据的可视化WO VS ST模型。模型的超参数WO,两条曲线变得更接近,直到达到更好的结果(图15)。 根据我们以前的工作,我们已经指出了最有前途的参数,以收敛的WO模拟模型的ST模型。 在这些参数中,参数u(风速)和所做的修改在0.1至7.0的值范围内进行了测试。改变这个参数会加重时间序列的一般曲率,点之间更接近,点的最大振幅更大。接下来,我们评估了更改“张力”参数对时间序列的影响。电压参数的值的范围是1到40,000。值的范围很大,已经确定电压具有很大的影响,并且探索间隔的步骤应该要足够小,不要错过有趣的时间序列来利用。在最后,以步长100探索值的范围给出了更容易利用和转置到其他时间序列的结果。此外,电压参数= 100的定义导致最大振幅的显著增加在研究了参数u和h对模拟时间序列的影响之后,我们将研究扩展到了模拟器配置中定义的参数cl0和eps。导致时间序列的最大幅度线性增加。改变eps的值对大多数时间序列没有影响,一些时间序列显示eps = 0.85时振幅增加。当然,这是在调用Hyperopt优化算法之前作为示例完成的,以便允许自动化并快速搜索这些最佳参数(参见图1A和1B)。 7、10和11)。3.2. 建模在“数据可视化”部分创建的训练集为了比较,我们比较了Y/D表1我们的基准测试结果:在这里,我们只采用了两种类型的指标:RMSE来证明不同模型的误差,R2得分来说明它们的预测能力(只要R2得分接近1,这意味着有问题的模型具有更 好 的 预 测 能 力 ) 。算法R2Score RMSE随机森林(RF)0.322 1.1334678543987654e−05LR 0.234 9.1254678543987654e−06AdaBoost 0.299 6.3334678543987654e−06SVR 0.294 7.8284678543987654e−06XGBoost 0.390 5.6565898765678943e−06DNN 0.400 1.7676789874657436e−08ENS 0.699 7.5676543245673839e−09Opti-ENS 0.697 6.0773736543334343e−09通过一系列模型对我们的OPTI-ENS模型的预测结果进行了比较。表1总结了通过理解一些机器学习算法获得的R2得分和RMSE结果。R2分数给出ST数据与预测数据的接近程度的指示。R2得分越高,预测质量越好。由于R2 Score本身并不存在,因此计算RMSE(作为示例)以表明最佳模型也必须具有最弱的RMSE。图15和图16显示了线性回归模型与我们的ENS模型相比的一些预测结果的示例。线性回归模型(如一个例子)与ENS模型相比具有非常高的RMSE。与R2评分相同,ENS模型的R2评分接近线性回归模型的两倍。从结果图15和16的结果以及表1中的基准结果,我们可以看到,我们的集合模型的预测能力证实了最先进的结果,即集合模型产生H. Amroun等人阵列15(2022)1001878见图8。 仿真数据WO与ST的可视化。见图9。 仿真数据WO与ST的可视化。见图10。 通过使用线性回归模型训练WO数据来预测ST模型数据。正如您在这里看到的,使用此训练模型,Y/D是穷的。H. Amroun等人阵列15(2022)1001879图十一岁通 过 OP TI - E N S 模 型 训 练 WO 数 据 预测ST模型数据。这里可以清楚地看到,y/d值的预测质量非常好。见图12。在这里,我们比较了我们的处理管道,即OPTI-ENS与单独的ENS(未优化)。 总的来说,我们可以说OPTI-ENS方法在执行速度、GPU/CPU使用率和训练方面更加灵活。这可以通过以下事实来解释:大多数数据收集处理是通过优化算法完成的,这有助于之后用于学习模型的构建阶段的任务。还必须指出的是,OPTI-ENS比ENS具有更大的灵活性就使用计算资源的可能性而言,这在例如被迫在“大"环境中工作时更有利。数据”,这是事实在数值模拟或流体力学的大部分工作表2在精度和执行时间方面将Hyperopt与ENS配合使用的结果算法R2Score执行时间(s)ENS+Hyperopt(OPTI-ENS)0.697 13.76 sENS 0.699 2465 s比单独使用的模型更好的结果。ENS模型的预测能力主要是由于XGBoost模型的特点在不太大量的数据上产生结果,以及DNN类型模型对时间序列的预测能力,特别是在对数据进行几乎是原始的时间序列表2显示,OPTI-ENS模型的预测能力大约是未纳入Hyperopt模型的传统ENS模型的170倍以上。图17总结了考虑的所有要素(此外为了证明我们approach.图18显示了测试所提出方法的可靠性所需的要素。鉴于所提出的模型是机器学习模型,我们的方法的可靠性应该通过现有技术中大多数作品已经推荐的传统方法来验证,即:将数据集细分为三个集合:(i)用于构建模型的训练集,(ii)用于验证模型的验证集,以及最后(iii)用于测试其泛化能力的测试集。 作为本文的一部分,对上述三点进行了检验和验证。因此,我们希望通过图1和图2的表格中给出的元素来关注更广泛的验证。 12&13.4. 讨论Hyperopt优化算法的选择是通过几种方法的实验得出的。正如我们在“方法学”部分所解释的H. Amroun等人阵列15(2022)10018710图十三. 我们在本文中提出的机器学习方法通过我们在本表中提到的一种技术进行了验证。这里我们的论文,我们验证了我们的两步方法的有效性:(i)首先,我们使用一个数据集细分为三个数据集:训练数据集,验证数据集和测试测试其泛化能力。因此,现有技术建议采用这种验证模式。另一方面,在一个更一般的框架中,我们可以验证通过验证至少四个基本点,即:道德、治疗管道、验证技术和测试模型,来评估我们这样的方法的有效性。也有我们还测试了其他验证模式,这些模式基于添加另一个数据集并按原样使用模型。结果与我们在这里提出的相差不远。作为一个指示,我们已经获得了RMSE 8.97e-09,它仍然略高于我们在构建模型期间获得的RMSE,这仍然相对正常,因为任何机器学习模型在其使用期间训练,获得的结果将小于其创建期间获得的结果,然后逐渐改善结果,因为该模型还从错误中学习并自我纠正。梯度下降法是一种求微分函数最小值的方法。梯度下降法顾名思义是一种基于梯度的方法。一个多元函数在某一点上的梯度是一个向量,它表征了该函数在该点附近的变异性。梯度由函数的导数计算。如果梯度很高,则函数远离最小值,如果梯度很低或为零,则我们接近最小值。随后必须通过梯度下降算法使成本函数最小化,以便获得接近ST模型的WO模型。在我们的例子中,根据以前在RTE内部进行的工作,成本函数是不可访问的,因此不可微。这就阻止了梯度下降法的使用对于成本函数,我们查看了均方误差(RMSE)的根。RMSE函数在2系列点之间的值之间的差异的框架内被完美地定义。该方法评价残留物的分散性我们发现WO时间序列和ST时间序列不是由相同数量的点组成ST和WO的时间序列具有相同的最终时间(tf),但不具有相同的时间步长,因此ST模型和WO模型之间的点是不相同的。点数的差异使得不可能应用RMSE等方法来比较2个模型。RTE团队指出了最有希望的参数,以使WO模型向ST模型收敛。这个参数是u(风速)。已对该参数的变更进行了测试,数值范围为0.1至7.0。这个参数的修改强调了时间序列的一般曲率,点更接近。点所取的最大振幅较大。然后,我们评估了改变电压参数(H)对时间序列的影响。电压参数的取值范围为1 ~40000。由于值范围很大,因此已经确定电压具有很大的影响,并且用于探索间隔的步长应该足够小,以免错过要利用的有趣时间序列最后,以步长100探索值的范围,得到更容易利用和转置到其他时间序列的结果。此外,电压参数= 100的定义导致最大幅度的显著增加。在研究了参数u和h对模拟时间序列的影响之后,我们将研究扩展到了H. Amroun等人阵列15(2022)10018711WO。参数c10的值的增加导致时间序列的最大幅度的线性增加。改变eps的值对大多数时间序列没有影响,但是一些时间序列显示eps = 0.85时振幅增加。人工方法使得有可能获得令人感兴趣的结果。 通过迭代和使用二分法探索方法,我们得到了视觉上近似WO模型的模拟结果。然而,手动方法没有对其他时间序列给出结论性结果。这 主要是由于相应时间序列的WO执行时间。我们设法获得有希望的结果的2个时间序列是在长度(最终时间)方面最短的时间序列,这导致了较低数量的点,因此是那些需要较低执行时间的时间序列。 这使得快速缩小搜索范围成为可能。然而,对于其他时间序列,这种方法证明是不够有效的。 我们意识到,对于每个时间步,WO产生一个值,而ST的模型对于每个时间步产生两个值:一个正值和一个负值。为了能够创建一个模型,我们首先专注于参考模型的积极价值。我们从WO中检索数据来训练模型,并从ST中检索模型数据作为测试数据。我们首先将时间序列连接起来,然后将模拟数据和参考数据分开,其中80%的数据用于训练,20%用于验证。在某些情况下,我们在ST的时间序列中得到不可利用的值,例如缺失值(NA)。 这些值是从学习集中编辑的。最后,我们确保包含参考数据的向量的长度与训练的长度相同。我们还尝试了一种基于模拟生成的新方法,其最大幅度最接近ST模型的最大幅度。然而,这种方法并没有提供比基于视觉相似性的经典方法对y/d值的预测结果表明, 显示我们的OPTI-ENS模型与现有技术中众所周知的模型相比的预测能力[43基本模型如因为线性回归显示非常低的预测以及非常高的RMSE。使用随机森林模型观察到一个小的改进,但这在预测误差方面仍然不够,预测误差仍然很高。DNN类型的模型也显示出改进 在RMSE和R2得分方面的预测质量中,但在R2得分方面保持低于0.5。 OPTI-ENS模型超过了所有受试模型(表1),并在R2评分和更好的误差(RMSE)方面获得了更好的结果。这解释了ENS模型的能力和预测能力,因为结合DNN(由于我们提出的ReLu函数的修改以及提出的预处理方法,DNN被设计为具有更好的神经元数量)和一系列XGBoost,DNN参与更好地管理来自WO模型的原始数据。此外,XGBoost模型还具有预测能力,提高了预测效果.这些结果与最新技术水平一致,其中几项研究显示了这种类型模型的预测能力[47,48]。我们的模型特别是从其结构中获得了力量,该结构由回归点中已知的XGBoost模型组成,而且具有神经架构(DNN)的模型的力量在模型的实施中增加了更多的灵活性,这对预测的质量产生了积极影响[495. 结论在本文中,我们提出了一种方法,允许校准以最佳和自动的方式建立模型,该模型允许再现架空线路导体的振动行为。尾流振荡器模型实际上是物理条带理论模型的近似表示。为了生成模拟数据,后者的实现是复杂的,WO模型使得近似ST模型成为可能。为了能够在这个近似过程中使用WO时间序列的时间序列。考虑到计算的复杂性和由这种操纵引起的沉重性,这显然是不可想象的。因此,WO模型需要额外的干预或修改,以便有效地生成WO模型的数据。为此,我们使用了一个模型,通过使用机器学习来优化WO的计算。事实上,学习模式需要作为输入的时间序列所产生的WO模型通过优化模型:Hyperopt和生产作为输出的输出,将产生一个ST模型。我们的优化和机器学习框架使预测ST模型的输出值成为可能,误差非常低,数据生成速度非常快。这项研究将使人们有可能在不久的将来建立一个工具,直
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- SSM动力电池数据管理系统源码及数据库详解
- R语言桑基图绘制与SCI图输入文件代码分析
- Linux下Sakagari Hurricane翻译工作:cpktools的使用教程
- prettybench: 让 Go 基准测试结果更易读
- Python官方文档查询库,提升开发效率与时间节约
- 基于Django的Python就业系统毕设源码
- 高并发下的SpringBoot与Nginx+Redis会话共享解决方案
- 构建问答游戏:Node.js与Express.js实战教程
- MATLAB在旅行商问题中的应用与优化方法研究
- OMAPL138 DSP平台UPP接口编程实践
- 杰克逊维尔非营利地基工程的VMS项目介绍
- 宠物猫企业网站模板PHP源码下载
- 52简易计算器源码解析与下载指南
- 探索Node.js v6.2.1 - 事件驱动的高性能Web服务器环境
- 找回WinSCP密码的神器:winscppasswd工具介绍
- xctools:解析Xcode命令行工具输出的Ruby库
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功