鲁棒迁移字典学习算法应用于工业过程监控研究

178 浏览量更新于2024-01-22 收藏 1.3MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

工程7（2021）1262研究AI赋能流程制造-Article一种用于工业过程监控的鲁棒迁移字典学习算法杨春华，梁慧萍，黄可可，李永刚，桂伟华中南大学自动化学院，湖南长沙410083阿提奇莱因福奥文章历史记录：收到2020年2020年6月27日修订2020年8月25日接受2021年8月4日网上发售保留字：过程监控多模式过程字典学习迁移学习A B S T R A C T数据驱动的过程监控方法由于其通用性和对反应机理和第一原理知识的需求减少而成为复杂工业系统的主流。然而，大多数数据驱动的过程监控方法都假设历史训练数据和在线测试数据遵循相同的分布。实际上，由于工业系统的环境条件恶劣，实际工业过程中采集的数据往往受到多种因素的影响，如操作环境的变化、原材料的变化、生产指标的变化等。这些因素往往会导致在线监测数据和历史训练数据的分布不同，从而导致过程监测任务中的模型不匹配。因此，当从训练数据学习的模型应用于实际在线监测时，难以实现精确的过程监测。针对工业过程监控中运行环境变化导致的历史训练数据与在线测试数据分布不一致的问题，提出了一种鲁棒迁移字典学习（RTDL）算法RTDL是代表性学习和领域自适应迁移学习的协同作用该方法将历史训练数据和在线测试数据分别作为迁移学习问题的源域和目标域最大平均差异正则化和线性判别分析类正则化被引入到字典学习框架中，从而减少了源域和目标域之间的分布差异这样，即使在真实多变的操作环境的干扰下，源域和目标域的特征明显不同，也可以学习到鲁棒的字典这样的字典可以有效地提高过程监控和模式分类的性能大量的实验，包括数值模拟和两个工业系统进行了验证的效率和优越性所提出的方法。©2021 THE COUNTORS.Elsevier LTD代表中国工程院出版，高等教育出版社有限公司。这是一篇CC BY-NC-ND许可下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）中找到。1. 介绍过程监控对于工业系统是必要的和有意义的，并且吸引了工业界和学术界的大量关注[1一般来说，过程监控方法分为三类：基于模型的方法，基于知识的方法和数据驱动的方法[5基于模型的方法使用系统的数学表示，从而将对系统的物理理解纳入监测方案。的*通讯作者。电子邮件地址：huangkeke@csu.edu.cn（K. 黄）。基于知识的方法使用诸如PetriNets、多信号流图和贝叶斯网络（BN）的图形模型来进行系统监控和故障排除。这种方法特别适合于预测耦合系统[9]。数据驱动的监测方法不需要反应机制或过程的第一原理知识近年来，通过利用智能传感器，数据分析和深度学习技术的快速进步，数据驱动方法已经开发出来，以提高诊断的有效性和性能[10];该领域的进展包括Boltzmann机，支持向量机（SVM），卷积神经网络（CNN）等[11近年来，数据驱动方法已成为复杂工业过程监控的主流。https://doi.org/10.1016/j.eng.2020.08.0282095-8099/©2021 THE COMEORS.由爱思唯尔有限公司代表中国工程院和高等教育出版社有限公司出版。这是一篇基于CC BY-NC-ND许可证的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。可在ScienceDirect上获得目录列表工程杂志首页：www.elsevier.com/locate/engC. Yang，H.Liang，K.Huang等人工程7（2021）12621263然而，目前大多数数据驱动方法都假设历史训练数据和在线监测数据遵循相同的分布[14实际上，从实际工业过程中收集的数据总是受到许多因素的影响，例如多变的操作环境、原材料的变化和生产指标[17]。当基于训练数据学习的模型应用于实际在线监测时，这些因素往往会导致模型不匹配等问题。这些问题使得难以实现精确的过程监控。为了解决历史训练数据和在线测试数据遵循不同分布的问题，已经提出了开创性的工作。Hou等人[18]提出了一种用于时变过程监控的增量主成分分析（PCA）在线模型。在该模型中，当获得新的样本时，用原PCA模型更新PCA模型新样本、预测误差平方（SPE）和T2限制也更新了。Jiang等人[19]提出了一种基于当前数据和历史数据的多模型判别偏最小二乘（DPLS）方法来诊断数据。张等人[20]建立了一种具有较强泛化能力的深度信念网络（DBN），用于在线监测焊接状态。为了适应新数据样本的加入，Zeng et al.[21]提出了增量局部保留投影（LPP）算法，该算法通过使用拉普拉斯矩阵和原始样本的投影值来更新。然而，这些算法不能处理例如当被监测的工业过程位于完全不同的操作环境中时发生的两个域之间的大差异。Ge和Song[22]提出了在线批量独立成分然而，这种方法需要构建多个模型，并且数据的不平衡会降低监测性能。字典学习通常涉及学习过完备字典;然后，原始数据可以由字典和稀疏矩阵重建。真实的原始数据通常具有结构冗余的特征。通过字典学习，原始数据被映射到一个低维空间，这消除了原始数据的结构冗余，同时保留了最简洁的信息。Peng等人[23]提出通过LPP生成映射字典，以保持原始数据的几何结构。 Chen等人。[24]提出了一种方法，该方法利用字典正则化来创建从少量目标域数据中学习的字典;该字典类似于从源域数据中学习的字典。Zhang等人[25]提出了一种方法，其中学习公共词典、源域词典和目标域词典以实现跨域分类。在Jie等人[26]提出的方法中，学习了源域字典和目标域字典之间的几个子空间字典Long等人[27]提出了一种转移稀疏码（TSC），通过引入图正则化，减小分布距离，实现知识转移。这些字典学习方法在信号重构、信号降噪、图像识别、图像校正等方面取得了很大的成就，引起了学术界和工业界的广泛关注。此外，最近的研究表明，词典学习在过程监控方面具有非凡的优势Huang等人[28]提出了一种核字典学习方法，耳过程监控和分布式字典学习方法实现高维过程监控。虽然上述方法在工业系统中表现出优越的过程监控性能，但它们没有考虑历史数据的分布差异和在线监控数据。迁移学习作为一种通用的知识迁移框架，近年来在人工智能、图像识别和计算机视觉等领域得到了广泛的研究受字典学习强大的表示能力和迁移学习跨领域知识迁移能力的启发，提出了一种鲁棒迁移字典学习（RTDL）方法，用于解决实际工业过程监控中的分布发散问题该方法是代表性学习和领域自适应迁移学习的协同总而言之，历史训练数据和在线测试数据分别被视为迁移学习问题的源域和目标域对于一个工业系统来说，虽然系统总是运行在不同的运行环境中，这就不可避免地导致了不同的数据分布，但底层的内部信息，如机制，往往是相同或相似的。换句话说，工业系统的高维观测数据通常在不同的域中具有不变子空间因此，将源域和目标域映射到一个共同的子空间是可行的，在该子空间中源域和目标域的分布差异被消除。之后，在学习的子空间中进行过程监控从实际应用的角度出发，提出了一种判别式字典学习方法来提取多模态工业数据的特征接下来，提出了最大平均差异（MMD）正则化[29]作为非参数距离度量来表示分布距离，这减少了源域数据和目标域数据之间的分布发散。此外，为了减少内部模式数据的距离，线性判别分析（LDA）正则化。因此，即使源域和目标域受到不同运行环境的严重影响，该方法也能学习到一个鲁棒的公共字典，从而有效地提高了进程监控和模式分类的性能.本文的主要贡献归纳如下。首先，提出了一种RTDL方法，以减少工业系统的多变的运行环境的负面影响。通过减少域间差异，该模型可以减少由于操作环境的变化而导致的过程监控和模式分类的其次，给出了约束不可微字典学习问题的具体优化步骤，有效地解决了RTDL问题。第三，通过大量的实验验证了所提出的方法结果表明，该方法可以优于一些国家的最先进的方法的准确性，因此，该方法是适合的任务，能够监测工业系统的过程。本文的其余部分组织如下。第二节简要介绍了领域自适应迁移学习、字典学习以及本文的写作动机。第三节提出了RTDL模型，并给出了有效的优化步骤。在第4节中，进行了大量实验，包括数值模拟、连续搅拌槽加热器（CSTH）基准案例和风力涡轮机系统案例，以验证所提出的RTDL方法的有效性最后，第5提供了结论和总结性评论。2. 预赛2.1. 域自适应转移假设存在具有大量数据的源域Xs1/2xs1;xs2;：;xns]（其中ns是源域数据Xs的数量）和具有少量数据的目标域C. Yang，H.Liang，K.Huang等人工程7（2021）126212642 2ð·Þ2Xt1/4/2xt 1;xt 2;：;xnt]（其中nt是目标域数据Xt的数量）。这里，源域和目标域是相关的，但不是相同的。以某风电机组为例，将风电机组冬季过程数据作为源域，夏季过程数据作为目标域。这两个域是相关的，因为每个域的数据是在相同的机制下从相同的风力涡轮机系统收集的。然而，由于外部运行环境的不同，两个季节的观测数据往往有不同的分布。在数学上，域的输入特征空间是相同的，但是域的边缘分布和条件分布是不同的;即，Xsv，Xtv，Psx - P t x和P s y x -P t y x，其中P s和Pt分别表示源域和目标域的概率分布;v表示数据空间;x表示数据样本;y表示数据x的标签。为了在目标域中实现过程监控，需要消除源域和目标域之间的分布分歧--即条件分布差异和边际分布差异。在消除源域和目标域的分布差异后，源域数据可以表现出与目标域数据相同的过程信息，因此本发明可以利用丰富的源域数据，辅助培训模式，从而达到积极的知识转移效果。2.2. 字典学习字典学习的哲学是通过学习由一系列原子和稀疏矩阵组成的字典来最小化数据重构错误。令 XN^l/2Xl;X2;：：;XN]2Rm×N为原始样本的集合，其中XN表示具有m的维数，m是数据维数，R是向量，空间，N表示数据量。DK<$1/2d1;d2;：dK]2Rm×K是由K个原子组成的字典，其中DK 是的第K原子和K 是的number原子。SN2RK×N表示稀疏矩阵.字典的问题2.3. 动机如前所述，尽管工业系统可以在不同的操作环境下操作（例如，由于外部干扰，例如不同的位置、时间、天气和人工操作），这不可避免地导致数据分布的发散，潜在的内部机制通常彼此相同或相似也就是说，工业系统在不同领域下的高维观测数据往往具有不变子空间。因此，有必要提取不变性知识或子空间，以消除外部干扰，从而进一步提高工业过程监测的性能。为了形象地展示源域数据和目标域数据之间的可传递特征的效果，图1示出了仅受导致不同分布的不同环境因素影响的数据的散点图。源域和目标域的边际分布和条件分布有明显的不同。传统的数据驱动方法有两种常见的策略：如图1（a）所示，第一种策略是忽略源域数据，只使用目标域数据作为输入数据，以满足训练数据的分布与测试数据的分布相同的假设。然而，由于目标域中的训练数据很少，最终模型容易过拟合。如图1（b）所示，第二种策略是忽略源域和目标域的不同特征。该策略直接使用大量的历史数据和少量的新数据进行模型训练，最终得到的模型混淆了域间差异信息和异常信息。此外，该模型很容易被源域所支配，因为源域具有大量的样本。相比之下，图1（c）显示了本文提出的RTDL模型。该方法尝试到找到一映射关系功能联合通过这种映射关系，原始数据被映射到一个子空间。在这个子空间中，源域的边缘分布和条件分布是相同与目标域的那些相同;即，PsUxPtUx，学习可以表述如下：DK;SNð1ÞPsyjUxPtyj Ux（其中U（x）是关于x的映射）。我们相信，如果U·S能够克服F0DK;SN其中a（a> 0）是控制SN的稀疏性的参数，k· kF表示矩阵XN的F范数，并且k· k0表示矩阵SN的L0范数。外部环境，只保留最简洁的内部机制信息，实现知识从源域到目标域的传递。也就是说，通过将MMD和LDA类正则化合并到字典学习目标函数中，所提出的方法可以利用丰富的Fig. 1.该图描述了具有大量源域数据和少量目标域数据的情况。(a)传统的策略1忽略了源域，只利用目标域数据进行模型训练。（b）传统策略2忽略了源域和目标域的不同特征，直接利用所有数据进行模型训练。(c)RTDL模型将源域和目标域的数据约束规则化，消除了域间差异，是三种模型中最合理的PC1和PC2代表数据的两个主成分C. Yang，H.Liang，K.Huang等人工程7（2021）12621265222我我P P¼212 fgF1/1我我ikFc1¼X？nsiXSJ-Xsj？¼XtrSi Mi STxa<$;xa2目标域我获取域数据。为了简单起见，我们记录稀疏的我我我我我M1;M2;.. . ;MC¨¨¨ð6Þ源域数据辅助训练模型，达到传递效果，以提高工业过程监控。X-DSinkFD;SkDSoutkFð2Þ3. 方法在详细讨论该方法之前，先介绍一个假设在此介绍所提出的方法。这个假设是合理的，而且工业系统经常满足这个假设s： t：8kdbk2≤1其中db表示字典D的第b个原子。Sin和Sout是关于S的表达式，如下所示假设：一个复杂的工业过程通常以不同的模式运行，以满足不同的实际需求.不同模态下观测变量的特征不同。为了清楚地描述不同的观察结果，年代S半a;b]¼. S½a;b]半a;b]¼. S½a;b]xa;db2相同模式否则xa;dbR相同模式ð3Þð4Þ将训练数据和在线测试数据分别作为源域和目标域。出来0否则一般来说，有两种方式进行多模数据其中xa是X的第a个样本。过程监控的第一方式是到治疗多模数据分离，然后完成过程监控任务特别地，kX-DSk2¼PCkX-D S意味着单独地第二种方法是处理多模式数据球，I2C我02ally，然后使用单个模型完成过程监控任务。当每种模式收集的数据足够时，第一种方式是更好的选择。然而，对于实际的工业过程监控任务，目标域中的数据往往严重不足，单独的方法容易出现过拟合，因此最好全局处理多模态数据此外，观测变量不仅由工业过程的内部机制决定，而且还受外部环境（例如，手动操作、不确定性、参数测量的不连续性和噪声）。在线测试数据的外部环境与历史训练数据的外部环境不同为了获得准确的过程监控结果，明智的选择是使用域自适应迁移学习方法来消除无关的外部干扰。3.1. 判别字典和子稀疏矩阵Si。也就是说，kD SoutkF1/4i我0ikDiSikF.因此，项Si0. i0- i 0应该尽可能地接近零。3.2. 正则化由于工业系统的源域和目标域受环境因素的影响不同，数据分布也不同。为了确保学习字典捕获潜在的公共机制信息，而不是源域和目标域中不相关的外部干扰，一种直接的方法是通过最小化一些预定义的度量来减小分布差异。MMD正则化被认为是一种非参数度量来表示域之间的分布差异[27]，它可以使稀疏矩阵Ss;i和St;i的中心接近。在数学上，MMD正则化表示如下：传统的词典学习已经被广泛地介绍用于过程监控。此外，最近的研究表明，1nti-是的。- 是的Σ我 1/4trSMSð5Þ学习判别字典可以使字典能够具有识别模式的能力[30因此，迫切需要一种用于过程监控任务的区分性字典学习方法。在这里，判别字典是记录为D1/2D1;D2;：：;DC]2Rm×C k，其中C表示模式的数量，k表示每个模式的原子的数量，并且D C是用于表示第C个模式的特征的k个原子的子字典。原始样本的稀疏矩阵（S）我爱你，我爱你，我爱你其中，c1表示源域和目标域之间的MMD正则化，nsi和nti表示在源域和目标域中的第i个分别地，sj是稀疏矩阵S中的稀疏码，Mi表示MMD矩阵M的第i个模式部分，其可以如下计算：矩阵（十）超过 D是S1;S2;：;SC]2RCk×Nsnt，哪里CSCtCSC8>1=n21=n2x;x2源域S S;S，S表示第C模式源的稀疏编码a'一阿阿在数据Xi应该由它自己的子字典Di很好地表示¼MiCC. Yang，H.Liang，K.Huang等人工程7（2021）12621266≈我.Σ我我8表示Mi的第a行和第a列中的元素为了提高多模态的表示能力，数据时，应将先验约束纳入字典学习首先，数据应该由dic很好地重建表和相应的稀疏矩阵;即X DS。次其次，数据应该由它自己的子字典很好地表示D i和子稀疏矩阵S i;即，X i<$D i S ii2 f 1; 2;：;Cg.第三，由于数据可以很好地由自己的子代表字典和子稀疏矩阵，项Si0i0-i 应该越尽可能地接近零，所以Eq. （1）可以转化为以下形式[31]：C. Yang，H.Liang，K.Huang等人工程7（2021）12621267sj2SiJ我J我umn，xa<$是X的第a<$个样本，x a是X的第a个样本。众所周知，在同一模式下观测数据的分布应该相同。然而，由于不确定性在不同的运行环境下，同一模式下的数据也表现出一定的差异。为了消除来自不确定环境的干扰，无论数据来自哪个域，都优选地使相同模式数据的稀疏码变得彼此更接近。也就是说，Si1/2Ssi;Sti]8i2f1;2;：;Cg中的每个列向量应该彼此接近。因此，在本发明中，P的值。别...别这样应该尽可能的小C. Yang，H.Liang，K.Huang等人工程7（2021）12621268P¼ ð Þ新F.ΣD;SCkSP .×0000 0 ;0;0 bS.j12jjjjjjjJ.Σ[/]pF. J . 1Mjj2M-HjjFFF12JJJJrG<$x<$k≤k;如果jxj ¼0pJJJJ我在哪里是Si的中心。因此，以下约束L.D;~k=1/4trac e.Xnew-DSnew应该介绍。CCk克·J.PmD½i;j]-1美元;8kj≥0ð12ÞcXX。S-谢谢s-s轴tr.S IHST7联系我们2½j-i¼1sj2Siij-i¼ð-Þð Þ其中L是拉格朗日函数，！k½½k;k;：;k]是引进的其中c2是指所有模式的模式内距离，并且I是非负参数12Ck单位矩阵LDA类矩阵H可以如下获得：（12）D产生拉格朗日函数1T对偶问题，如下：H1;H2;：：;H2;：：;H3 ; H4 ; H5 ; H6; H7; H8其中1 ni 是一个长度为n i的向量，所有元素都等于1，B. ~k最小L.D;~k.不.-1。联系我们新新新是源域中第i个模式的数据总数，目标域。Eq的正则化（7）看起来相似到LDA正则化[34]，所以从这一点开始，它将被称为1/4跟踪X新Xnew-K -XnewSTSnewSTKXnewSTð13Þ总之，MMD和LDA类正则化可以是被认为是一种进步的关系。MMD正则化使各模态的源域中心接近各模态的目标域中心。以互补的方式，LDA类正则化使得相同模式的数据彼此更接近，以便减小模式内距离。基于其中B是拉格朗日对偶公式;K是对角矩阵，支持！K，K诊断！K. 拉格朗日对偶问题（Lagrangiandualproblem）（十三））可以通过牛顿法或共轭梯度法进行优化在最大化B. ！k∈ K，我们得到最优基D如下：这两个正则化的协同效应，所提出的方法通过加入Eqs. （2）、（3）和（7）一起;所提出的方法的目标函数可以重写如下：DT¼。S新不新-1.X新科技简体中文2 2D;S=argmin kX-DSkFkX-DSinkF kDSoutk2akSk0b1tr.公司简介b2trSs： t：8db≤ 1ð9Þ3.3.2.更新S矩阵S将逐列更新。当sj被更新时，目标函数可以表示如下：sj¼argmin f.sjSJ2 2 2其中b1和b2（b1;b2>0）分别是MMD正则化和类LDA正则化的超参数;以及1/4argminkxj-DsjkF kxj-DQjkF kDPsjkFSJð15Þ这些超参数可以平衡的重量之间重建误差和正则化约束。由于所提出的方法减少了P. 你好第1页.T TTsjsjsjhj源域和目标域，可以达到消除外界环境干扰的效果。3.3. 优化上述目标函数的优化变量是D和S。由于优化问题不是两个变量的联合凸问题，而是分别对D（当S固定时）和S（当D固定时）凸的，因此引入了交替优化方法来计算最优值。D和S的迭代使用[35]。其中Q、P和hj是目标函数简化过程中的中间变量。Q¼对角线0;0;：; 1; 1;1;：;Ck Ck–Q是对角矩阵，并且1仅存在于对应的j的模式的k个位置。xj是X中的第j个样本。是的，第p个元素在s中j.我们优化Eq. （15）通过特征符号搜索算法[27，35]。定义g 如下：G.sjkxj-Dsjk2kxj-DQsjk2kDPsjk2- 是的BM bð16Þ当通过固定S来更新字典时，目标函数可以简化为D1/4argminkX-DSk2kX-DSink2kDSoutk2FF其中g sj是等式的可微部分。（十五）、为了解决Eq. （15），应引入一个引理。FDs： t：8kdbk2≤1ð10Þ引理一曰：定义一连续功能超过x作为FxGxkkxk1;的最优必要条件在构造新的数据矩阵和新的稀疏矩阵 Xnew 之后，X;X;O ， S 新S;Sin;Sout，其中O是与X相同的维度，目标函数（等式2）。（10）成为D¼argminkXnew-DSnewk2;8kdbk2≤ 1× 11 Ωx¼argminFx areX（rpGxksignxp^0;ifjxpj..p8x17mmD目标函数可以通过使用拉格朗日对偶方法有效地求解[35]。首先，考虑Lagrangian：DS拉瓜3.3.1.更新D2C. Yang，H.Liang，K.Huang等人工程7（2021）12621269其中Gx是向量x[36，35]，xp是向量x中的第p个元素，rpG<$x<$是G<$x <$在xp上的偏导数。C. Yang，H.Liang，K.Huang等人工程7（2021）12621270J. -是的布雷尔河DdJ.Σ.. -是的JJppJJ.Σjjr-p.ΣJ最小^f.^sjjjjxj-D^^sjjj2jjxj-DdQ^sjjj2jdD P^sjjj2.b1Mjjb2I-H^sT^sj^sTh^ja^hj^sjJ1JJ2JJJJJJJJJJ. J .rFFFJJJJJ域数据xj在训练集中;重建的残差算法1.稀疏矩阵优化算法。输入：数据矩阵X、MMD矩阵M、LDA类矩阵H、参数a、b1和b2输出：最优稀疏矩阵S开始优化算法对于S中的每个sj，步骤初始化：sj<$0，h<$0，活动集A=fg，其中h是表示sj的符号的向量，hp2 f-1; 0; 1g表示符号（s<$p<$0）步骤激活：从s j的零系数nts，选择p：¼argmax jrpg。是的。激活sp（将p添加到A），仅当它局部改善Eq。（15）如果如果fp gsj>a，则设置hp1/4 -1，A=fpg[A;否则，如果使p∈g sj<-a，则设hp<$1，A=fpg[A步骤特征-标志搜索：^^^设D、DQ和DP是D、DQ和DP的子矩阵，仅包含A中的列;设sj、hj和hj是sj、hj和h的子向量在A中，分别计算得到的无约束二次优化问题（QP）的解如果我们让@^f。^sj=@^sj0，we可以得到当前A下sj的最优值：^snew¼nD^TD^DdQTDdQdD PTdDP.bMbI-HIo-1。D^TxdD PTx-.a^hh^=2在从^sj到^snew的闭合线段上执行离散线搜索检查新的目标值以及任何系数改变符号的所有点将^sj（以及s中的相应条目）更新为具有最低目标值的点从活动集A中移除^sj的零系数并更新h：步骤检查最优性条件：(i) 非零系数的最优性条件：rpg。sjjujujujujujujujujujujujujujuju秒速时时彩0;8秒速时时彩-0如果不满足条件（i），则转到步骤(ii) 零系数的最优性条件：rpgsj≤a;8s≤p≤0如果不满足条件（ii），则转到步骤端末端优化算法证明：我们通过反证法提供一个简短的证明。假设在最优解中有一个元素xp，从零开始，任何对s的无穷小调整都会使溶液这不符合条件。一是对于sign ofs sign of signof signofsign of sign.因此，我们直接让sp的符号为-1。jxpjrGxk符号x- 0。因此，我们可以找到另一个值那么，f，s，j在s ∈ P ∈ S上同样可微，并且该问题可以简单地解决。 Ifrpg.sj-a，sp可以在xωp来代替xp，使F<$xω<$更小。这是一个反-给我的律师写的。其次，对于jxpj0，rpGx>k，因为Gx是一连续可微功能，我们可以找到一个xωp0来代替xp，并且满足G<$xω<$-G<$x<$kxωp<<因此，我们认为，FxωGxωkkxk1-kxωp< Gxk k x k1¼ Fx，这也与该命题相矛盾。对于xp0，pGx <同样的方法也可以用来证明这个假设是不正确的。根据引理1，等式1中的必要条件（15）可以描述如下：8>：。rpg.sj。≤a;如果. 是的。¼ 0rithm[37]用于计算目标的稀疏码sj当第一个条件被违反时，目标函数f sj由方程式（15）在sp上是可微的，因为sp的符号是可以获得训练集中的目标域数据的RES根据等式（十九）、J J已知，它成为无约束优化问题（QP）。当第二个条件被违反时，假设pg. sjn. 因为rpf。sj必须大于零，以便JJr¼kx-Dsk219其中k·k代表L而R是向量的范数，最小化f的局部值。sj，sp必须递减e。由于Sp22样本结构错误x。XC. Yang，H.Liang，K.Huang等人工程7（2021）12621271--00：00：0000： 00：00e645.Σ.Σ1[1/2]23452接下来，使用核密度估计（KDE）[38]计算目标2x13627--20：5768 0： 376636 7吨1不第二季第十三集627域，可用于检测是否有新的测试数据x¼6x 2019 - 01 - 2100：00：00第六季第三集ð21Þ是正常还是不正常当新的测试数据x来自目标域，稀疏码s通过使用相同的OMP算法，然后可以得到测试数据的RESr使用等式（十九）、当RESr属于上述分布区间时，为正态数据。否则，就是错误的数据。6-3762019 -01 - 2500：00：0000： 3972 00：8045不26475e5其中x-1/4h-x;-x;-x;-x;-x是是过程的观测变量3.4.2. 模式分类在检测出测试数据为正常数据后，进行模式分类，用Eq.（20）.监测，t1和t2是两个独立的输入变量，数据模拟模型，e1;e2;：;e5是由于当前环境干扰而导致的观测变量的噪声。为了模式1/4argminkx-Di sikF我ð20Þ为简洁起见，我们假设在源域和目标域中存在两种模式。模式状态由独立的输入变量t1和t2决定，而环境变量t1和t2决定。其中si是s的子稀疏码。总之，所提出的方法的完整模型流程总结在算法2中。参考值e1;e2;：;e5不同导致域差异。数据的详细描述如表1所示，其中Nu;r2表示高斯分布，其平均值为u，其变量为R2是R2。Ux;x-表示范围为算法2. RTDL。输入：源域数据矩阵X1/2×XX ]，目标从x到x-。表示指数分布，s s1;s2;：;ns参数. F-cq表示F分布，域数据矩阵Xt[1/2Xt1;Xt2;：Xnt]，参数a，b1，K;和b2开始RTDL算法步骤1。初始化结构数据矩阵X Xs1;Xt1;：;Xsc;Xtc;：;XsC;XtC，MMD矩阵M通过等式（4）和LDA类矩阵H，通过等式（八）、D和S被初始化为随机值，其中XsC和XtC分别表示源域和目标域的第C步骤2.离线训练迭代获得D和S为了固定S，使用等式更新D。（十四）为了修复D，使用算法1步骤3更新S。在线测试(i) 过程监控通过D和OMP和KDE算法获得RES限制通过比较RES统计和RES限制(ii) 模式分类在检测出测试数据为正常数据后，使用Eq. （二十）结束RTDL算法4. 说明性实验在本节中，在数值模拟、CSTH基准和风力涡轮机系统上进行了大量实验，以证明所提出的RTDL方法的有效性和优越性。为了便于性能可视化和参数敏感性分析，在数值模拟中分别引入了MMD正则化和LDA类正则化，使之能够直观地观察样本的分布。对于CSTH基准和风力涡轮机系统，将所提出的方法与一些最先进的方法进行性能比较。c和q表示的自由。从模式2收集异常数据在目标域中，偏置故障发生在x2中。对于训练数据，我们在源域中为每个模式收集100个正态数据，在目标域中为每个模式收集10个正态数据。对于测试数据，我们收集了50个正常的数据，每个模式和300个异常数据的目标域。4.1.2. 性能可视化实验如上所述，MMD正则化和LDA类正则化可以从不同的角度消除分布发散。为了验证两者都具有消除分布发散的能力，我们分别引入其中一个正则化参数，通过将另一个正则化参数设置为零，直观地观察样本的分布。训练数据被用来学习一个共同的字典。然后，通过公共字典和OMP算法得到源域数据、目标域数据和异常数据的稀疏编码。我们通过PCA可视化稀疏代码。可视化如图所示。二、图2（a）显示了原始数据分布。出现的域分布发散是由于环境干扰。异常信息模糊不清。图图2（b）和（c）表明，单独使用其中一种正则化，通过字典学习，分布发散被部分消除，异常信息出现。图2（d）示出了源数据和目标数据完全混合，并且通过使用两种正则化的所提出的方法可以容易地识别异常信息。因此，实验结果与本文的动机一致（第2.3）。表1数据生成的详细说明。模态变4.1. 性能可视化和参数敏感性分析t1t2e1;e2;：;e54.1.1. 数据集数值模拟的实验进行验证的动机和直观地评价性能。数值模拟的数据生成模型如下：源域中的模式1N 5; 0：8N15; 1：3 N 3E0：5 N源域中的模式2U2;3N 15;1：7 N 3E0：5N目标域中的模式1N5;0：8N15;1：3N0：1F-5;10模式2在目标域U=2;3=N=15;1：7=0：1F-15;10= 0-x5e47X44 5C. Yang，H.Liang，K.Huang等人工程7（2021）12621272图二、样品的分布（a）原始数据;（b）通过字典学习与LDA类正则化学习稀疏代码;（c）通过字典学习与MMD正则化学习稀疏代码;（d）通过字典学习与两种正则化学习稀疏代码4.1.3.参数敏感性分析实验参数α是判别学习中控制S的稀疏性的重要调节参数。一般来说，可以通过观察S的稀疏性来选择a，S表示矩阵S中非零元素的百分比。如图3所示，当使用以下方法时，可以获得令人满意的过程监控结果：稀疏率（SPR）的范围从20%到50%左右，因此，SPR的参数灵敏度分析验证了该方法的鲁棒性。接下来，将显示修改了B1和B2参数。设b1从101变到105，而b2从10变到70。以虚警率（FAR）和故障检测率（FDR）为评价指标用于过程监控。结果如图10和11所示。4和5. 可以看出，当改变b1和b2时，FAR总是低于3%，FDR总是大于80%即使b1和b2在很大范围内变化，过程监控的这种性能也值得称赞当b1和b2太小，学习的字典可以重建训练数据很好;然而，不相关的环境干扰训练数据也由字典学习。当b1和b2的值过大时，目标函数只是减小域间的分布差异，学习的字典不能很好地重构过程数据，数据中的机理信息等底层语义信息也会丢失.这两种情况都降低了字典捕获过程数据中常见潜在信息的能力，导致过程监控性能不佳。为了为这些超参数选择合适的值，可以选择诸如网格搜索的优化方法4.2. 性能对比实验4.2.1. 数据集由于所提出的方法在数值模拟中的性能是值得称赞的，我们现在将考虑其在现实工业场景中的性能。为这些实验准备了两个数据集。(1) CSTH：CSTH过程是一个非线性的真实平台，已被广泛用作评估不同图3.第三章。RTDL对FAR和SPR的灵敏度分析，参数为a。FAR：假报警率图四、参数为b1和b2的FAR的 RTDL的灵敏度分析。C. Yang，H.Liang，K.Huang等人工程7（2021）12621273ðÞðÞ图五、FDR的RTDL灵敏度分析，参数为b1和b2。过程监测方法[39]。CSTH的原理如图所示。六、在CSTH过程中，有两个物理平衡：质量平衡和热平衡。冷水和热水同时流入水槽，搅拌，并通过蒸汽加热[40]。假设该过程具有两种模式，其中模式状态由液位设定、温度设定和热水阀位置设定确定详情见表2。为了模拟环境干扰，我们将指数分布变量E 0：5添加到所有观测变量以形成源域，并将F分布变量0：1F-5;10添加到所有观测变量以形成目标域。一个加性故障施加到所观察到的流量变量，可产生异常数据。我们在源域中为每个模式收集100个数据，在目标域中为每个模式收集30个正常数据，以形成训练数据。测试数据由每种模式的50个数据和目标域中的200个异常数据组成。(2) 风机系统：风机系统数据来自北京某风电公司从2011年1月1日至2011年11月11日，每分钟对8台风力涡轮机的数据进行采样，表3所示的15维数据用于过程监测和模式分类。每个风力涡轮机的数据之间存在不同的流形结构夏季的气温和风力与冬季不同，导致风力发电机的运行温度和运行功率不同，见图6。CSTH原理图。TC：温度控制器; FC：流量控制器; LC：液位控制器; TT：温度传感器; FT：流量传感器; LT：液位传感器; sp：设定点。复制自Ref。[40]经Elsevier许可，©2008。表2CSTH的传感器电流信号设置参数模式液位传感器电流（mA）温度传感器电流（mA）水阀位置传感器电流（mA）模式11210.55.5模式21210.55.0数据分布的差异。风力发电机组在不同的海况下会受到不同的环境干扰.我们假设冬季是源域，而夏季是目标域。详细描述见表4。训练数据由用于源域中的每个模式的350个正常数据段和用于目标域中的每个模式的50个正常数据段组成。对于每个模式取50个正常数据和目标域中的300个异常数据来构成测试数据。由于风力涡轮机系统数据的维度差异巨大，所有数据在实验之前都被归一化。4.2.2. 过程监控为了定量评估所提出的方法，另外两个新的字典学习方法和自适应监测方法进行比较。此外，还使用了第2.3节比较方法包括：标签一致性K-奇异值分解（LC-KSVD）（S+T），LC-KSVD（T），Fisher判别字典学习（FDDL）（S+T），FDDL（T），移动窗口PCA（MWPCA）和RTDL。LC-KSVD[41]、FDDL[31]和MWPCA[42]方法是用于过程监控的三种最先进方法。LC-KSVD和FDDL具有模式分类的能力，而MWPCA是另一种自适应过程监控方法。这里，LC-KSVD（S+T）和FDDL（S+T）分别是指直接使用所有源域训练数据和目标域训练数据作为输入数据点而不考虑域之间的不同特性的LC-KSVD方法和FDDL方法。LC-KSVD（T）和FDDL（T）分别是指仅使用目标域训练数据作为输入数据点的LC-KSVD方法和FDDL方法。MWPCA方法直接使用所有的源域训练数据和目标域训练数据作为输入数据点，而不考虑域之间的不同特性。RTDL有区别地使用源域训练数据和目标域训练数据作为输入数据点。为了使比较公平，字典的大小和其他参数被设置为相同。为了比较模型的性能，我们参考了两个指标：F

下载后可阅读完整内容，剩余1页未读，立即下载