虚拟喷雾模拟：基于GAN的燃油喷射航空发动机条件相关模型研究

35 浏览量更新于2024-01-22 收藏 1.9MB PDF 举报

生成式对抗网络

多元时间序列

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

能源与人工智能12（2023）100216用于燃油喷雾Cihan Atesa，b，Zhao，Farhad Karwana，Max Okraschevskia，Rainer Kocha，Hans-Jörg Baueraa德国卡尔斯鲁厄理工学院、热力涡轮机械研究所b卡尔斯鲁厄理工学院（KIT），能源系统中的机器智能，德国H I G H L I G H T S• GAN与自动编码器（AE）相结合，进行虚拟喷雾模拟。• AE将可变长度的液滴射束转换为固定长度的表示。• 条件GAN模拟蒸发液滴的潜在表现。• 训练数据由高分辨率欧拉-拉格朗日LES模拟提供。• 预测精度高度依赖于编码方法。A R T I C L E I N F O保留字：生成式对抗网络燃油喷射航空发动机多元时间序列G R A P H I C A L A B S T R A C TA B标准在这项研究中，生成对抗神经网络（GANs）的概率，数据驱动的性质被用来进行虚拟喷雾模拟的条件相关的航空发动机燃烧室。该模型由两个子模块组成：（i）自动编码器，将可变长度的液滴轨迹转换为固定长度的低维表示;（ii）Wasserstein GAN，学习模仿蒸发液滴在其寿命期间的潜在表示。GAN模块也被调节为喷射位置和液滴直径以增加整个框架的通用性。训练数据由OpenFOAM进行的高分辨率三维瞬态欧拉-拉格朗日大涡模拟提供。神经网络模型是在PyTorch的开源机器学习框架内创建和训练的。所提出的方法的预测能力进行了讨论与喷雾统计和蒸发动力学。结果表明，条件GAN模型提供了很大的潜力作为具有高计算效率的低阶模型近似。尽管如此，自动编码器模块保留本地依赖性的能力应该得到改进，以实现这一潜力。对于当前的案例研究，定制模型体系结构能够在几秒钟内进行模拟经过一天的训练后，对于相同数量的液滴（200，000个轨迹），使用传统CFD方法在HPC上进行了一周的训练。通讯作者：卡尔斯鲁厄理工学院（KIT），德国热力涡轮机械研究所电子邮件地址： cihan. kit.edu（C. Ates）。网址：https://www.its.kit.edu（C.Ates）。https://doi.org/10.1016/j.egyai.2022.100216接收日期：2022年7月28日;接收日期：2022年11月16日;接受日期：2022年11月19日2022年12月21日在线提供2666-5468/© 2022作者。出版社：Elsevier Ltd这是CC BY许可下的开放获取文章（http://creativecommons.org/licenses/by/4.0/）。可从ScienceDirect获取目录列表能源与AI期刊主页：www.elsevier.com/locate/egyaiC. Ates等人能源与人工智能12（2023）10021621. 介绍近年来，航空业对环境的影响已成为一个主要问题，其中法律约束促使该行业进一步改进每个部件的设计，以实现环保目标。这里的一个关键方面是燃料喷射到加压燃烧室中，因为它决定了传热，蒸发和化学反应的速率，这反过来又决定了能量转换过程的清洁和高效程度。因此，喷雾分析及其准确表示对于新发动机设计研究至关重要。然而，收集这些信息是一个困难和昂贵的过程。进行高保真模拟是社区中捕获喷雾动态的常见策略，通常在拉格朗日框架中通过跟踪模拟域中的每个液滴束。然后，将液相物理与气相的欧拉模型耦合，以求解每个守恒律。在此，一个关键的计算瓶颈是拉格朗日相位计算及其与连续体的连接，其必须针对设计研究中建模的每种情况重新计算。在典型的工作流程中，为液滴动力学生成的昂贵的专有技术仅被利用一次，并且必须在每次设计迭代时重新学习和利用。因此，需要低阶但精确的喷雾动力学表示机器学习（ML）的前沿之一是生成建模，它依赖于表示学习。这种模型具有概率性质，并依赖于数据中发现的模式，这些模式随后可用于创建与原始数据集无法区分的新示例。特别是，生成对抗神经网络（GAN）能够隐式表示概率分布，连接训练数据集中存在的特征。自Goodfellow于2014年引入以来[1]，它已成为学术界和工业界用于合成数据生成的流行方法。常见的应用是图像/视频处理[2，3]、风格转换[4]、合成风景/音乐生成[5-包括GAN在内的深度生成模型的详细比较综述可以在[15，16]中找到。虽然GAN的能力已经得到了广泛的研究，但关于时间序列建模的研究相对较少。 TimeGAN [17]是顺序数据生成器的早期示例之一，其中结合了自动编码器模块和GAN模块。在这里，自动编码器学习创建原始固定长度序列的低维表示，GAN模型学习从相同序列长度的白噪声中创建潜在（低维表示）空间中的伪示例。在TimeGAN中，两个模块都是联合训练的，因此整个模型可以同时学习编码特征和生成样本。工作框架后来得到了扩展处理更具挑战性的时间序列问题，包括缺失数据和可变序列长度[18]。最近用于生成序列数据的GAN实现包括医疗时间序列（ICU）[19]，混沌系统[20]，智能电网的数据生成[21]，现货价格（S P500）[22]，测试卡车中的空气处理系统[23]，州一级的能源消耗[24]，建筑物中的能源使用[25]和负载场景生成[26]。为时间序列相关应用设计的GAN变体的详细调查和分类可以在[27，28]中找到。在这项工作中，我们部署了概率，数据驱动的性质，通过学习导致观察到的液滴轨迹的基本规律，GAN模拟航空发动机燃烧室中燃料液滴的统计数据。总的目标是创建一个概率模型，可以产生合成燃料喷雾，同时保存复杂的瞬态关系的功能，如速度，温度和直径。自定义GAN架构基于两个特定的模型：（i）RTSGAN [18]能够学习时间关系，（ii）cGAN [29]在学习过程中施加条件概率分布，试图提高所开发模型的泛化能力。这种修改允许在不同的初始位置处生成具有不同的初始液滴尺寸分布的人工液滴轨迹，使得其可以被部署以生成替代的喷雾场景。训练数据提供了高分辨率欧拉-拉格朗日大涡模拟蒸发喷雾云的范围内进行这项工作。通过使用内部开发的脚本对大量模拟数据进行后处理来完成数据准备，以过滤出具有几个时间分辨特征的液滴轨迹，所述时间分辨特征例如作为燃烧室内的停留时间的函数的单个液滴束的位置、速度分量、直径和温度。针对各种模式识别模型架构（即，自动编码器）并通过主成分分析进行比较。分析了真实轨迹和生成轨迹的喷雾统计，并讨论了调节策略2. 方法2.1. 生成GAN用于ML模型训练的液滴轨迹通过进行欧拉-拉格朗日模拟来生成，该模拟模拟航空发动机燃烧室的条件。在这项研究中，燃烧室几何形状近似为矩形区域（图1），其中喷油器由靠近进气口的钝体表示。燃烧室的尺寸是根据现代发动机中使用的环形燃烧室设计来设定的。形状和尺寸的非流线体是根据一个迭代过程来确定的，以产生一个中心再循环区（CRZ），平均来说，它与实际喷油器几何形状产生的区域相似（图10）。①的人。所调查的案件是非反应性和物理的案件研究，以及选择气相和液相的边界条件以反映后期重新点燃条件。选择该操作点有两个原因。(i)这项研究的主要目的是调查-门如何创建不同长度的合成多变量时间序列数据（即液滴轨迹）有效和准确，这仍然可以在一个非反应性的问题进行测试。因此，通过选定的操作点，燃烧器可以近似为伪惰性系统，其中大部分喷射燃料到达燃烧器出口未反应。(ii)在所选择的后期重新点燃条件下，气相温度足够高以增加特征空间的复杂性;也就是说，一些液体燃料仍然可以蒸发，特别是液滴尺寸分布的细小部分，使得在液滴尺寸、温度和液滴轨迹之间仍然存在复杂的物理耦合（特别是随着直径的变化而改变阻力行为气相模拟为空气，而液体燃料表示为正十二烷（C12 H26），它被认为是煤油的替代品。入口气体温度设定为515 K，以10 m/s的速度进入环形区域。瞬态两相流模拟通过开源CFD代码OpenFOAM使用sprayFoam求解器进行，该求解器能够在存在拉格朗日粒子云的情况下求解瞬态、可压缩和湍流所需的控制方程（时间方案：欧拉，梯度：高斯线性，发散：高斯迎风，拉普拉斯算子：高斯线性正交，单元格面插值：线性。溶剂;密度：PCG，压力：GAMG，物质：PBiCGStab.）。通过比较OpenFOAM环境中可用的URANS和LES模型，在使用相同设置进行初步单相模拟后选择湍流模型。由于URANS与壁面自适应局部涡粘性大涡模拟（WALE）相比计算效率不高，同时丢失了瞬时流动波动的信息，因此在扩展的两个模型中使用了LES。C. Ates等人能源与人工智能12（2023）1002163表1图1.一、具有演化相干结构和液滴轨迹的矩形解域。表3喷雾注射参数。初始液滴温度对应于二次雾化后的温度。考虑了喷油温度353 K。燃料名称C12 H26液滴温度415 K注射持续时间0.7 s燃料质量流率0.06 kg s−1初始液滴速度5 m s−1每秒粒子数40万表2初始液滴尺寸的Rosin-Rammler分布。喷雾数据是通过平滑粒子流体动力学模拟计算与内部开发code（turboSPH）[30].参考直径100 × 10−6 m宽度参数2.5下直径值80 × 10−6 m上直径值200 × 10−6m相流模拟除阻力外，所有作用在燃料液滴上的力都忽略不计。考虑到燃料的蒸发，液体燃料液滴从图1所示的方形喷射块（黑线）的边缘喷射。1.一、表1液滴尺寸分布基于在雾化过程的SPH模拟上（见表2），并且在产生液滴包裹的同时在注射斑处均匀地取样。还应注意，这些初始条件代表二次雾化过程之后的分布一旦完成CFD模拟，就针对每个时间步长过滤相关拉格朗日相变量（液滴ID、直径、温度、速度和位置）。然后将二进制格式的原始数据转换为可以处理的VTK格式LES参数。亚网格尺度模型网格尺寸（非结构化）3 mmCourant编号0.1时间步长1 × 10−6 s溶液写入间隔1 × 10−4 s方便地在Python中。在下一步中，应用min-max-scaling 这是数据驱动的远程学习方法中的一项共同战略。最后，创建了一个numpy数组，该数组通过使用液滴ID存储每个液滴在燃烧室中整个生命周期的轨迹信息，液滴ID是每个液滴的唯一特征。液滴轨迹阵列的时间维度的大小通常在300-700之间变化（即，2D阵列的时间深度），这取决于其蒸发和轨迹动力学。总共提取了200，000个轨迹，可以通过数据可用性中提供的链接下载。2.2. 条件时间序列GAN当前研究的目的是通过学习导致观察到的液滴轨迹的基本规律来学习航空发动机燃烧室中燃料液滴的统计数据，同时保留特征（位置、直径、温度、速度）之间的这是通过结合两个神经网络模型实现的该模型的一般架构如图所示。二、液滴轨迹仅用于训练自动编码器模型，独立于GAN模型。自动编码器由两个子神经网络组成：编码器和解码器。在训练期间，液滴轨迹被馈送到编码器模型。它由一个多层的GRU网络和隐藏的维度组成.��由于其固有的特性，GRU细胞可以学习并保持其状态函数中时间序列的顺序依赖性，克服了普通RNN细胞的常见记忆问题。编码器的目标是简化生成C. Ates等人能源与人工智能12（2023）1002164��图二. 实现模型架构。顶部：自动编码器，底部：WGAN型号。学习过程，通过将可变长度的液滴轨迹压缩成固定长度的潜在表示轨迹。��换句话说，潜在向量的维度与序列长度无关。另一方面，解码器的作用是学习如何将压缩数据展开为可变长度序列。自动编码器的训练通过液滴轨迹的重建损失（Δθ-Δθ）来完成。应该注意的是，每个输入到模型的时间序列实例都包含两种类型的特征：全局特征和动态特征（dynamics features，缩写为DYNAMIC）。��全局特征不随时间变化，因此对于序列样本是恒定的（它们是从动态特征中提取的）。全局特征的例子是序列本身的类标签或属性，例如序列长度。另一方面，序列的动态特征（直径、位置、速度、温度）随时间变化。训练实例是来自两种特征类型的数据的串联。序列长度的全局特征是特别重要的，因为它使得将压缩的固定长度数据解码回其原始形状成为可能。这被反映到损失函数中，作为全局特征和动态特征的重建损失的线性组合。交叉熵和均方误差损失分别用于分类特征和连续特征。创建潜在向量的详细过程可以在[18]中找到。��整个建模框架的生成部分是GAN，它试图从随机噪声向量中创建逼真的压缩表示（压缩表示）。它是由两个相互竞争的神经网络构建的，称为生成器和神经网络。生成器的任务是从噪声向量中创建��相反，判别器的任务是判断样本是真的还是假的（由生成器合成生成）。这种对抗性的过程可以被视为作为发电机和发电机之间的最小-最大博弈。在vanilla GAN中，目标函数可以表示如下：min max��Edata（）�� [log（）]+Ez��（）��[1 − log（（））]（1）其中E表示期望值或期望值。训练判别器，使其最大化将真实标签分配给传入样本log（（log））的概率，而训练生成器，使log（1-（（log）最小化。每个网络权重的迭代更新（即，模型参数）通过反向传播算法完成。这里的一个实际解释是，对于生成器来说，该函数的作用就像一个学习损失函数。由于不可能先验地定义一个真实样本的损失函数，GAN的目标是通过神经网络（也称为社区中的批评者，取决于损失函数的定义）将其隐式地学习为参数化模型。在目前的工作中，WassersteinGAN（WGAN）被用作稳定训练的生成模型[31]。潜在空间中假样本和真实样本之间的Wasserstein距离用作训练的反馈，并使用[32]的权重裁剪实现。为了创建可变长度的液滴轨迹，RTS-GAN实现[18]被改变。自定义实现可以在补充材料1中找到。代码中有两个主要更新。首先，调整原始模型，使得可变长度序列可以被重建以反映液滴在燃烧室中的不同停留时间。例如，停留时间液滴的速度、初始直径和喷射位置以及瞬态气相流动动力学会使液滴的速度发生剧烈变化。值得一提的是，RTSGAN的作者发布了两个不同版本的代码。一个版本适用于完整和固定长度的序列（C1），而另一个版本（C2）适用于不完整和可变长度的序列。在这项工作中，C1代码版本被修改为能够与可变序列长度一起工作。这是通过从C1和C2创建混合版本来完成的。一个关键的变化是将包含序列长度信息的全局特征添加到训练数据集的每个训练实例中，作为预处理步骤。这个全局特征仅仅是一个表示序列长度的整数。在编码器模型中，这些信息被嵌入到潜在空间表示中。�� 因此，它可以是解码器模型解码回正确的序列长度后，C. Ates等人能源与人工智能12（2023）1002165��表4针对自动编码器模块测试的超参数在训练后具有最低的重建损失。RNN单元结构隐藏维度数（维数）损失值��GRU 16 1e−4GRU 24 5e−5GRU 48 6e−4LSTM 24 5e−5LSTM 32 5e−5训练当GAN用于生成假示例时，它可以仍然生成具有变化长度的轨迹，因为它被生成器解释为学习的潜在空间表示的为了对喷雾的初始状态进行控制，需要对RTSGAN进行进一步的修改。如引言部分所述，这项工作的目标是创建喷雾模型，其中液滴轨迹可以以初始直径和初始位置为条件。因此，现有的GAN架构被转换为条件GAN（CGAN）。CGAN是香草方法的扩展[1]，于2014年首次引入。CGAN的目的是通过使用附加信息来调节生成器和模型，以控制模型的输出，从而从指定的类中生成样本。CGAN的目标函数变为：minmax ��E��data （ �� ） [log （ ��|�� ） ]+ E��z （ �� ） [1 − log （（ ��|�� ）） ]（2）发现表现不佳（1 e-4），最好的训练性能是在学习率为1 e-3时达到的。其他超参数按照RTSGAN研究中的建议保留[18]。自动编码器和GAN模块的训练在bwUniCluster上使用一个GPU（NVIDIA Tesla V100）和所有14个处理器节点（Intel Xeon Gold6230）进行。自动编码器和GAN模块的训练分别花费24小时和12小时。一旦模型经过训练，在典型的办公室PC上生成完整的喷雾模拟大约需要10秒。3. 结果3.1. 用于重构液滴轨迹的自动编码器评估自动编码器模块的目标是最小化输入张量（轨迹的时间和特征维度）和输出张量之间的差异（图2）。��这种差异通常被称为重建误差。一个小的重建误差表明，autoencoder是能够压缩数据到一个较低的维度空间，通过保持大部分的信息。然而，这个损失值是一个全局度量，只给出整个轨迹（张量）上的平均损失，不提供任何关于特征的空间和时间依赖性（或错误起源于何处）的信息。因此，需要对不同位置处的个体属性（直径、速度、温度、位置）进行额外的统计分析，以提取关于以下各项的更具体的信息：该附加信息可以是类别标签或来自其他模态的数据。它通过一个额外的输入层集成到ADC和生成器中[29]。对于液滴轨迹问题，我们用指示注射位置（即，初始位置）或液滴尺寸。类标签被实现为整数，在训练和推理期间用作条件信息。在模型中，类标签输入到嵌入层，嵌入层将输入转换为10维向量。然后将条件向量与噪声向量连接在一起。最后，将得到的向量馈送到发电机。在训练条件向量的过程中，条件向量也与隐藏表示连接在一起真的或假的样品。总之，调节允许要求生成器模型不仅创建真实的液滴轨迹，而且从给定位置和/或定义的大小开始2.3. 模型实验和培训为了训练自动编码器和WGAN，轨迹数据集（200，000个实例）通过两种不同的策略下采样到20，000个。首先，轨迹被随机采样，而不管它们的初始条件。然后用另一个随机选择的20，000个轨迹的子集来测试模型。然后，我们首先根据轨迹的初始属性（注射补丁位置，直径）将其分类为32类，然后以与大型初始数据库具有相同概率分布的方式对它们进行下采样。用第二种策略训练的模型也在随机选择的相同大小的测试集上进行了测试。在这两种情况下，模型的预测准确性保持不变，无论如何，创建训练集。在这个初始观察之后，针对自动编码器模块和GAN模块测试了一组不同的超参数，以减少训练集，从而加快训练时间，特别是对于自动编码器。在此，RNN单元架构（LSTM/GRU）和隐藏维度的数量如表4所示。对于每个实验，训练时期的数量被设置为1000，并且在训练期间获得的最佳权重集被保存。然后使用性能最好的Encoder变体在GAN模块的潜在空间（隐空间）中创建训练示例GAN模块的超参数测试仅限于学习率。对于当前的案例研究，较低的学习率是度量，在四个不同的等距位置的全局统计数据进行评估，通过构建每个物理特征的概率密度函数（PDF）。然后将这些函数与相同位置处的原始密度函数进行比较。学习和重建的PDF之间的相似性显示了自动编码器模型学习和保留轨迹中的时间和空间相关性的能力。为了量化自动编码器是否能够适当地捕获蒸发物理，这在特征或PDF中是不可直接看到的，使用第三度量。还介绍了在本文中，通过比较在模拟域中的预选位置处的两个相对接近的评估平面之间的液滴体积的增量变化（即，微分体积元素）来估计耦合热效应（蒸发和膨胀的速率）。作为最后的比较，重建轨迹的例子。此指标用于定性目的，并允许对模型的性能进行更实用和直观的查看通过对一批样本应用均方误差来确定轨迹的重建损失。在训练之后，在训练集和测试集中的所有情况下，最高重建误差都在1 e-4的量级，这表明序列重建过程是全局准确的。表现最差的是GRU(48)如6 e-4（表4）。如前所述，重建损失并没有提供关于自动编码器性能的很多见解，因为它仅测量重建的2D阵列的总体成功。因此，它无法描述保留了多少时间或成对关系（例如直径与温度）。换句话说，我们需要部署替代指标来量化从可变长度、多变量时间序列数据到固定长度、潜在向量表示的数据转换过程的预测准确性。为了量化在自动编码器模块中学习因果关系的程度，我们首先比较了原始样本和重建样本的20，000个液滴轨迹的全局喷雾统计数据。测试轨迹从主要示例池（200，000个样本）中随机取样。通过比较垂直于主流方向（0.033 m，0.103 m，0.173 m和0.243 m）的四个等距评估平面上每个特征的构造概率密度函数（PDF）来检查统计一致性。图图3示出了液滴直径、温度、一个速度分量和一个位置特征的几个示例。所有人的PDF每个特征的重建在这项工作中，作为一个额外的C. Ates等人能源与人工智能12（2023）1002166图三. 原始（蓝色）和重建数据（橙色）的全局喷雾统计数据，包括液滴直径、温度、一个速度分量和一个位置特征。pdf文件根据平面位置处的20，000个轨迹计算：1=0.033 m，2 = 0.103 m，3 = 0.173 m，4 = 0.243 m。其余部分见补充材料2。在所有四个平面上测试的自动编码器模型可以在补充材料2中找到。无论部署的RNN细胞类型（GRU/LSTM）或隐藏状态的神经元数量如何，原始数据和重建数据的PDF都显示出明显的偏差，并且重建数据的PDF只能在少数平面中匹配原始数据。重建误差通常在更靠近注射位置的平面处更小，并且在更下游的位置处偏离原始序列更多，对应于更晚的停留时间。为了评估原始PDF和重建PDF之间的相似性，我们使用了一种简单的二进制分类方法。如果重构的PDF和原始PDF对于给定特征是相似的（例如，直径），则该方法得到+1的分数。��例如，值为4表示模型能够为该特定特征的所有四个平面再现准确的PDF（参见补充材料2，了解所有特征和模型的可视PDF比较）。如果没有定性地捕捉到分布，我们给零分。这里，相似性意味着小于C. Ates等人能源与人工智能12（2023）1002167见图4。通过不同的自动编码器架构计算的潜在空间向量的前两个主成分的比较。0.3.然后，对于每个自动编码器模型，对所有特征重复该分级。然后将总分相加，作为模型性能的指标。表5总结了所有特征的重建喷雾PDF的准确性，作为累积评分。列和行分别表示测试的自动编码器模型和轨迹特征。从表5中可以看出，数据编码和随后的重建过程不能正确地保留沿燃烧室的特征的时间演变，尽管全局重建损失非常低（表4）。可以看出，在全局统计数据的重建方面，一些相对更成功，例如LSTM（24）和GRU（24）。尽管如此，基于RNN的自动编码器未能捕获多变量时间序列中的时空依赖性（个体特征如何随时间变化以及它们如何在时间上相关为了分析不同的解码为了解释这些策略以及为什么我们在低重构误差的情况下观察到局部特征概率分布中的这种偏差，主成分分析（PCA）被用于由每个自动编码器模型生成的潜在表示（潜在表示）。原则上，编码策略的有用性来自于它能够用低得多的维度投影（投影而不是投影）来表示稀疏的高维数据，同时保持尽可能多的原始特征空间的信息。��在这里，感兴趣的问题是，基于RNN的自动编码器是否学习了整体数据表示，或者它是否足以提取特征内的因果依赖关系以及相对于时间的依赖关系。因此，我们想分析潜在数据空间的复杂性作为代理，类似于[25]的工作。使用线性PCA，可以看出前两个主成分构成潜在空间中总方差的>98%，这表明潜在空间中的压缩数据被投影到简单流形中。应该注意的是，PCA是在潜在空间表示z上执行的（图2）。2），因此隐含地包括液滴轨迹的整个寿命。有趣的是，所有自动编码器模块的液滴轨迹的潜在表示（除了GRU（48），由于其相对较高的维度）在潜在空间中具有相似的分布（图11）。4）. 特征嵌入在潜在空间中并不因潜在空间维数的增加而改变，也不因RNN细胞的记忆功能而改变。当这些编码的特征被解码器构造回来时，特征统计显示出相对于原始轨迹的显著局部差异，如图1所示。图3和表5中的轨迹分布与原始轨迹分布不匹配为了进一步研究低训练误差和捕获局部特征统计的准确性损失之间的差异，将差分燃烧室体积内的总液滴体积的变化作为附加标准进行评估。此积分值被视为自动编码器工作良好程度的指标捕获感兴趣的全局变量，例如给定平面处液相的体积变化。为此，通过在四个轴向位置放置两个间距为1 mm的平面偶来定义不同的燃烧室体积。在图5中给出了在四个平面处相对更好地执行自编码器的所得到的相对百分比音量变化。可以看出，该模型在平面方向积分量中产生非常高的精度（最大轴值为1.25%）。GRU（24）的重建精度相对优于LSTM（24）架构，对于LSTM（24）架构，原始和重建的平面平均体积变化之间的差异小于1%。LSTM（24）模型倾向于高估体积变化，这可能与温度升高时人为的更大膨胀有关。特别是，当比较GRU（24）和LSTM（24）的温度PDF时，可以看到GRU（24）的峰值温度向更高的温度移动，而LSTM（24）的情况正好相反（所有温度PDF请参见补充材料2）。在最接近的平面（101）处，发现原始数据中的净微分体积变化略为正值，这是由于与蒸发引起的体积损失相比，与热气体接触时体积膨胀的影响更大。��这样的效果不能用基于GRU或LSTM的自动编码器来保持。平面体积变化分析经验地表明，基于RNN的自动编码器倾向于在训练期间最小化全局表示的差异，而不是提取和学习时间序列数据中的时空变化，这是需要的精确的低阶模型替代详细的拉格朗日轨迹模型。上述讨论的观察结果表明，需要替代方法来完全捕获多变量特征空间中的时间和空间相互作用。例如，卷积神经网络可以帮助构建分层数据表示，并提供一种有效的方法来通过内核集提取这些局部关系。这里的一个实际问题是输入数据的大小可变，取决于液滴的初始大小和轨迹，液滴的寿命存在差异。即使在模拟的非反应性发动机条件下，液滴的寿命也表现出复杂的分布（图7（a））。为了缓解可变长度问题，我们认为分布可以离散成有限区间的bin，卷积自动编码器（cAE）的集合可以通过将仓内的实例填充到最大大小来训练（图7（b，c））。为了测试上述假设，我们训练了100-120个时间帧的轨迹间隔的cAE（即，[100，10]到[120，10]的数组）。缺失值的样本用零填充。在初步的训练实验中，发现120 × 10对于CNN层来说太偏斜而无法工作。因此，阵列被重组为40 × 30的形状，同时保持液滴属性的原始特征空间在一起（即，10个块）。几个模型结构与变化的层数，过滤器和内核大小进行了测试。图图7（d）示出了具有最佳模型超参数的液滴的示例轨迹。在第一个编码层中，使用了16个过滤器，内核大小为（10 × 1），最大池化为（2，1），试图在给定时间学习特征间的依赖关系。下面的编码层使用8个内核（2 × 2）。对于解码，使用了四个CNN层，并且仅在第三层中进行上采样。使用相同的误差函数来训练整个模型。原始轨迹特征与重建轨迹特征的比较表明，适当的编码策略，可以学习时间演化轨迹的多维特征空间。然而，应该注意的是，在这些孤立的CNN实验中，学习空间比基于RNN的编码器简单得多，基于RNN的编码器包括具有更宽的液滴直径和停留时间分布的不同物理机制。此外，整个集合cAE的训练将需要大量的超参数测试以最大化局部重建精度，C. Ates等人能源与人工智能12（2023）1002168图五、由GRU（24）和LSTM（24）自动编码器重建的相对液滴体积变化。见图6。使用CGAN模型（直径调节）采样液滴轨迹。同时确保整个方法不会过拟合。在这里说明的空间和时间相关的数据的编码中的困难表明，需要进一步研究如何处理可变长度、多变量时间序列数据，同时保持局部关系和因果关系，作为高级目标，例如当创建生成的、低阶的模型表示（即，数字孪生（digital twins）的物理资产（如航空发动机燃烧室中的燃料喷射器）在本地和全球层面都需要高精度和准确性。在这里，除了简单的填充之外，还可以测试不同的分箱和上采样策略，以提高模型在未来工作中的鲁棒性。3.2. 用CGAN在前一节中，已经表明，原始液滴轨迹数据的基于RNN的编码能够捕获积分量，例如给定平面处的液滴体积变化。尽管如此，发现特征的局部概率密度分布是难以学习的，无论自动编码器的复杂性如何。即使是最好的模型也不能捕捉到全部的局部统计数据，特别是在燃烧室出口处。为了评估编码方法是否可以通过替代方法加以改进，表5用于重构喷雾统计的全局评估矩阵功能GRU（16）GRU（24）LSTM（24）LSTM（32）��0 2 1 03 0 2 1��3 2 3 3��0 3 3 1��0 0 1 0��0 3 3 2��0 0 3 3最终得分（∑）6 10 16 9在这种方法中，假设卷积自动编码器（cAE）的集合，其将在可变长度轨迹数据的不同部分上进行训练。我们测试了一个cAE的想法，并证明时空关系可以学习。尽管如此，即使对于单个cAE单元，该模型也确实需要超参数调整，其中大约40个需要创建集合模型。在在本节中，我们将集中讨论问题的第二部分，即探索隐式生成模型在复杂输入数据的简单潜在表示下的能力。特别地，将讨论定制CGAN模型的性能作为生成燃料喷雾模型，假设通过以下方式产生的潜在空间：C. Ates等人能源与人工智能12（2023）1002169见图7。轨迹寿命分布（a），关于轨迹的时间维度的分组思想（b）及其与集合卷积自编码器的集成(cAE)有填料（C）。在轨迹间隔[100，10]-[120，10]（d）中，使用单个cAE对重建轨迹进行采样编码-解码模型对于执行这样的评估是足够有意义的。提出这一假设是为了详细阐述整个建模框架的瓶颈，为今后的工作提供参考.为此，训练的自动编码器模块GRU（24）与GAN模块协同使用，因为它在所有其他模型中表现出最佳性能（参见第3.1节），并且在感兴趣的平面积分量中产生低误差（1%）。这里，自动编码器的任务是将可变长度序列压缩成固定长度的简单表示。然后，CGAN模型创建类似的隐藏表示，生成器，它是通过使用来自批评家的反馈来训练的（图10）。2）的情况。然后将对合成（或假）潜在表示进行解码以创建人造液滴轨迹。应该提醒的是，遵循这种策略的原因是通过将问题的维度从大约5000维减少到24维来放松学习隐式耦合概率分布的难度。图图6示出了以初始液滴直径为条件的CGAN模型生成的单个液滴轨迹的时间演变。一般来说，生成器似乎了解特征的趋势C. Ates等人能源与人工智能12（2023）10021610图8.第八条。使用CGAN 模型（直径调节）重建（橙色）和生成（绿色）轨迹的全局喷雾统计数据。尽管对于某些轨迹，曲线可能看起来更嘈杂。��通常实际地预测该位置，因为这几乎是相对于序列步长的线性函数。在某些情况下，液滴尺寸和温度之间的相关性表现得相当好。然而，在其他情况下，预测的温度显示出不自然的振荡（更多示例见补充材料2对于横向和轴向速度分量，合成轨迹被发现模仿流场中观察到的波动GAN模块以初始直径为条件的全局喷雾统计数据如图所示。8 .第八条。PDF是使用20，000个真实和虚假的轨迹构建的。应该注意的是，将生成的喷雾的PDF（假数据）与重建的数据进行比较C. Ates等人能源与人工智能12（2023）10021611图9.第九条。使用CG AN 模型（位置调节）重建（橙色）和生成（绿色）轨迹的全局喷雾统计。由于AE模块在局部统计中已经存在误差，因此需要对实际喷雾轨迹进行量化，以量化源自GAN模块的误差。与实际喷洒数据的比较见补充材料2。可以看出，在某些平面上，重建的轨迹特征的PDF被很好地捕获，而在其他平面上，统计学没有被正确地学习生成模型产生较低在第一采样平面处的较大液滴的数量和细小液滴的数量更高。对于第二采样平面，找到两条曲线之间的最佳匹配。重叠随着增加而-坐标（轴向），其中生成模型倾向于低估细液滴的数量。温度分布仅在第二个平面上得到合理的捕获去C. Ates等人能源与人工智能12（2023）10021612图10个。不同初始直径的原始样本和假样本的 2D 潜在表示之间的比较。通过PCA降低视敏度CFD生成的数据（图中的橙色点）10），但可以接受的方差。这里的一个重要观察是GAN模型不受模式崩溃问题的影响。生成器可以提供遵循原始分布的不同示例，并且不会聚集到潜在空间的小区域中（即，生成非常相似/相同的样品，这些样品对于批评者来说是可接受的）。潜在空间中的比较表明，调节GAN相对于初始液滴属性可以成功地控制模型的创造性，即使是多变量时间序列问题。应该注意的是，除了可以调节的GAN之外，还有其他生成学习方法，例如高斯混合模型[33]或隐马尔可夫模型[34，35]。可在后续研究中进一步探讨这些替代办法的能力。还应该注意的是，很难直接解释GAN等生成模型的结果。最好的情况是，图十一岁GA N 模块的训练损失函数的演变（直径调节）。在下游，与重建的轨迹相比，较低的温度峰值被高估，而较高的温度峰值被低估。关于三个速度分量的性能在不同的位置有所不同。初始位置的分布被很好地捕获，然而在较大的振幅下，因此在稍后的时间，发现PDF之间的重叠减少。一般而言，发现生成轨迹的PDF与重建数据之间的差异朝向燃烧室的出口减小。当模型以初始位置为条件时（图 9），有没有太大的改善相比，直径调节GAN（图。8）。位置调节并没有影响模型的性能方面的位置，温度或速度的统计。有趣的是，发现液滴直径的PDF比由直径调节的GAN在所有四个平面中生成的PDF更差。换句话说，与对初始位置的调节相比，对直径的调节是相对更成功的策略。这可能是由于燃料喷雾相对于方位角对称的事实，因此与直径信息相比，调节yz平面上的位置不会带来关于轨迹动态的与自动编码器模型类似，我们通过PCA分析研究了生成轨迹的低维表示，并将其与真实样本进行了比较。图图10示出了对于不同的液滴尺寸范围（即，承载原始潜在特征空间的总方差的98%以上的前两个PC）。在此，三个类根据液滴的初始直径选择了3种尺寸的液滴进行可视化：小液滴（116 μm）、中液滴（140 μm- 152 μm）和大液滴（188 μm- 200 μm）。��可以看出，直径调节的GAN可以相对于所请求的直径标签生成接近潜在空间中的原始样本的样本。由于其概率性质，假样本散布在- 测量所生成的数据和原始数据之间的相似性，诸如朝向训练11的结束收敛的Wasserstein距离。然而，即使在这种情况下，“距离”本身也是一个抽象的量。因此，特别是对于面向科学或工程的应用，生成模型的评估应该与问题的物理学相结合，以便更好地解释。在目前的工作中，我们使用了替代指标，例如分析通过PDF和积分量（如平面平均体积变化），根据其统计数据对生成的轨迹进行分析。在未来的工作中，可能值得研究修改错误定义的附加值，以训练生成模块从物理问题的已知统计中注入更多的物理作为正则化项。还应该注意的是，如果我们特别感兴趣的话，直接学习高维特征空间（即使我们解决了可变序列长度问题，也是5000维）中的底层多模态概率分布是一项极具挑战性的任务保持瞬时液滴轨迹的局部相互依赖性。这就是为什么在训练生成模型之前，数据表示的简化被认为是一个关键的先决条件。我们的分析表明，这个预处理步骤仍然非常困难，即使我们将其与生成学习过程解耦。具有复杂记忆功能的基于RNN的模型最多能够跟踪感兴趣的综合变量，例如差分燃烧室体积中的液滴体积变化。当我们用集成cAE思想7进一步简化数据表示的预处理时，发现编码-解码性能要好得多。这些比较表明，在自动编码策略中，对于这种高维数据的整体学习过程的瓶颈，并且需要进一步研究以建立能够保持局部多模态依赖性的鲁棒方法。4. 结论在这项工作中，一个定制的条件GAN模型进行了测试，作为一个统计喷雾模型，以生成人工液滴轨迹的航空发动机燃烧室。它包括两个主要特点。第一，它有能力C. Ates等人能源与人工智能12（2023）10021613处理可变长度的序列。第二，可以通过定义初始液滴直径或初始液滴位置来使模型以不同的初始状态为条件。用于训练的数据集是从瞬态欧拉-拉格朗日CFD模拟中提取的。由于输入特征空间的高维性，（3000-7000），生成性学习任务分两个阶段进行：（i）通过自动编码器将可变尺寸的液滴轨迹数据编

下载后可阅读完整内容，剩余1页未读，立即下载