一维视觉Transformer与多尺度卷积融合轴承故障诊断

5星 · 超过95%的资源 需积分: 50 16 下载量 27 浏览量 更新于2024-08-04 收藏 1.53MB PDF 举报
"这篇论文提出了一种用于轴承故障诊断的一维视觉Transformer模型,结合了多尺度卷积融合(MCF-1DViT),旨在解决传统基于卷积神经网络(CNN)的故障诊断方法无法有效捕获滚动轴承的时间信息的问题。通过设计多尺度卷积融合层(MCF)自动并有效地从采集的振动信号中提取多尺度特征,随后引入改进的视觉Transformer架构来处理这些特征,从而提高诊断性能。" 在当前的工业设备健康管理(PHM)领域,轴承故障诊断是至关重要的任务,因为轴承故障可能导致严重的设备停机和经济损失。传统的基于CNN的方法虽然在图像识别和模式分析方面表现出色,但在处理一维时间序列数据(如机械振动信号)时,可能无法充分利用时间上的连续性和动态变化信息。 本文提出的MCF-1DViT模型,其创新点在于结合了一维视觉Transformer与多尺度卷积融合层。一维视觉Transformer(1DViT)是对二维视觉Transformer的扩展,适应于处理一维序列数据,如声音、振动等信号。Transformer以其自注意力机制,能够捕捉到序列中的长距离依赖关系,这对于理解和诊断滚动轴承等旋转机械的故障至关重要。 多尺度卷积融合层则是为了增强模型对不同时间尺度特征的捕获能力。在机械设备的振动信号中,故障特征可能在不同的频率或时间窗口内出现。通过多尺度卷积,模型可以同时学习到短期和长期的特征,使得故障检测更为精确。 论文中,MCF层与1DViT的结合策略可能是先通过多尺度卷积提取多尺度特征,然后将这些特征输入到Transformer结构中,利用Transformer的自注意力机制进行全局信息整合,进一步提升特征表示的质量。实验结果通常会对比传统的CNN模型和其他Transformer变体,证明MCF-1DViT在轴承故障诊断的准确性、鲁棒性以及泛化能力上的优势。 这篇研究工作提供了一种新的视角来处理一维时间序列数据,特别是对于工业设备健康监测和故障预测,有望推动相关领域的技术进步。通过将Transformer的强大学习能力与多尺度卷积的特征提取能力相结合,MCF-1DViT模型为未来轴承故障诊断和其他类似应用提供了有力的工具。