首页transformer interpretability beyond attention visualization

transformer interpretability beyond attention visualization

时间: 2023-06-05 22:47:50 浏览: 246

Transformer-Explainability:[CVPR 2021]超越注意力可视化的变压器可解释性的官方PyTorch实施，这是一种通过基于变压器的网络对分类进行可视化的新方法

的PyTorch实现[CVPR 2021] 更新 2021年3月15日： 2021年2月28日：我们的论文被CVPR 2021接受了！ 2021年2月17日： 2021年1月5日：介绍的正式实现。我们介绍了一种新颖的方法，该方法可以可视化基于Transformer的模型针对视觉和NLP任务进行的分类。我们的方法还可以可视化每个班级的解释。方法包括三个阶段：使用我们新颖的LRP公式计算每个关注矩阵的相关性。每个注意力矩阵的梯度反向传播与可视化类有关。渐变用于平均注意力头。具有推出功能的图层聚合。请注意我们的，您可以在其中运行本文中的两个班级特定示例。要添加另一个输入图像，只需将图像添加到，然后对您选择的感兴趣的类使用generate_visualization函数（使用class_index={class_idx} ），而不指定索引将可视化顶级类。学分 ViT

Transformer的可解释性超越了注意力可视化。这意味着，除了注意力可视化之外，还有其他方法可以解释Transformer的工作原理。例如，可以使用梯度、激活、特征重要性等技术来分析Transformer的内部机制。此外，还可以使用对抗性攻击和对抗性训练来测试Transformer的鲁棒性和安全性。总之，Transformer的可解释性是一个广泛的研究领域，需要不断探索和发展。

阅读全文