噪声图像分类的因果变换方法：治疗学习因果转换器(TLT)

201 浏览量更新于2024-06-20 1 收藏 4.02MB PDF 举报

本文探讨了如何利用处理学习（Treatment Learning）的原理来提升噪声图像的分类性能。当前深度学习（DL）主导的视觉模型在训练和测试时，往往依赖于数据样本与标签之间的内在关联，但这种方法在面对噪声数据时表现不佳。文章中提到的挑战包括训练集的噪声、测试集的清洁度以及图像中的上下文噪声和加性噪声，这些都可能导致模型性能下降。作者提出了一种名为治疗学习因果变换器（Treatment Learning Transformer, TLT）的新型架构。TLT受到因果变分推断的启发，利用潜在的生成模型来估计噪声图像的强特征表示。该模型能够根据估计的噪声水平（表示为二进制处理因子）动态调整，并采用特定的因果损失函数进行训练，以适应不同噪声级别的图像分类任务。为了验证TLT的有效性，作者构建了一个新的噪声图像数据集，包含了多种噪声类型，如对象掩蔽、样式转移和对抗性扰动。实验结果显示，TLT在噪声图像分类任务上表现出色，且通过多种评估指标得到确认。此外，TLT还改进了对感知噪声图像的视觉显著性检测方法。文章开头提到了深度神经网络（DNN）在图像识别任务上的卓越表现，但同时也指出，过度依赖相关性可能在处理噪声图像时产生问题，比如对物体姿态变化的敏感或者对不可感知扰动的脆弱性。真实的图像分类场景常常伴随着丰富的上下文和噪声，因此，发展对噪声有鲁棒性的模型显得尤为重要。 TLT模型通过引入因果图模型（Causal Graphical Model, CGM）的概念，如图1所示，展示了处理噪声信息的重要性。CGM中，Z代表不可观察的混杂变量，Y表示结果（如标签），而T是二进制处理信息，指示了噪声或额外模式的存在。在训练时T是可见的，而在测试时则不可见，模拟了实际应用中的情况。这篇研究工作强调了处理噪声数据对于提升深度学习模型性能的必要性，并提供了一个新的解决方案——TLT，它能够通过因果推理有效地应对图像噪声，从而改善分类性能。通过实验证明，TLT在噪声图像处理上有显著优势，不仅适用于分类任务，还能优化视觉显著性分析，展现了其在复杂视觉环境下的应用潜力。

6142

| ∼ |

∼

（

，

）

（

，

）

（

）

iiii

t=1

，

t=0

，

i t

，

=0，i

Transformer

关键，价值

干净的特征图（

t =

）

查询

ResNet

编码器

特征

图

（

4x4

）

（

z| x

，

）

图片

（

128 x

自适应平均池+线性乘法

融合特

征

Noisy feature map

地图

（t =1）

（

，

）

卷积模块

求和

（

t| x

）

Bernoulli

解码器

（

x|z

p（y|z，

（z

（

y|z

，

t = 1

p（y|z，

（

t|z

）

(a)模型网络（解码器）

t = 0

图2：我们提出的因果Transformer的编码器（推理网络）结构我们利用q（z x

，

t）的双线性融合（BF）而不是

级联[44]，并且解码条件查询H

q（y x

，

t）和编码特征H

p（x）作为键和值来进行注意。解码器如图所示。

2（a）与来自p（z）的潜在结果建模[29，73]。

直接映射到潜在空间（在我们的编码器中的顶部路

径），从残差块提取的特征图被提供给其他切换（在

我们的编码器中的下部和中间路径），其提供处理

和

结果

的后验估计。切换机制（基于

= 0或1的治疗信

息的二进制选择）及其交替损失训练已广泛用于

TARNet [76]和CEVAE [44]，具有理论和经验证明。我

们使用开关机制的分布：

（

）

Bern

（

）;

（

，

）

（

）

（

−

）

（

））

，

（

）

其中每个

是近似

（

tixi

）

或

（

yi xi

，

）的神经网

络。他们引入了辅助分布，

帮助我们预测新样本

的

和

。为了优化这

两个分布，我们在N个数据样本上的

整体

模型训练目标中添加了一个辅助目标：

aux

（log

（

）

log

（

，

））

，

（

）

其中

，

和

是训练集中的观测值。由于z上的真实后

验依赖于x，t和y，最后我们使用下面的后验近似：

我

，

+（1−

）

，

+（1−

）

，

（

，

）

，

（

，

））

，

（

，

）

，

（

，

））

其中g

再次表示神经网络近似，并且

（

，

）是

的共享、双线性融合表示，

剩余16页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

噪声图像分类的因果变换方法：治疗学习因果转换器(TLT)

对噪声图像进行处理

哈工程数字图像处理 试卷（2008年秋数字信号处理试卷（A卷）(双面)）

基于MATLAB的系统分析与设计——信号处理

信号的分类、处理步骤和分解方法

2第二章_z变换与离散时间傅里叶变换(DTFT).rar

《数字信号处理—基于计算机的方法》第三版(Mitra著)习题答案 第6章

数字信号处理：傅里叶变换对称性与单位阶跃、冲激信号解析

周期序列的DFS变换详解：离散信号处理基础

希尔伯特变换与窄带随机过程：信号处理关键解析

设计切比雪夫滤波器：基于幅度平方函数与数字信号处理

最新资源

哈工程数字图像处理试卷（2008年秋数字信号处理试卷（A卷）(双面)）

《数字信号处理—基于计算机的方法》第三版(Mitra著)习题答案第6章