NoiseGrad：提升机器学习模型解释性的噪声引入方法

190 浏览量更新于2024-06-19 收藏 1.83MB PDF 举报

" NoiseGrad: 改进机器学习模型解释性的方法通过在权重中引入噪声" NoiseGrad是一种创新的技术，旨在提升深度学习模型的可解释性。传统的深度神经网络（DNNs）因其强大的泛化能力和处理复杂模式的能力而被广泛应用，但同时也因其决策过程的不透明性而备受争议。在不可解释的人工智能（XAI）领域，解释模型的决策对于建立信任和确保在关键领域的安全应用至关重要。现有的归因方法，如逐层相关传播(LRP)、深度泰勒分解、分类激活映射(CAM)、GradCAM和集成梯度等，已成功用于解释单个输入的模型决策。然而，尽管这些方法有所成效，但它们仍然存在一些局限性，比如视觉扩散问题，这可能导致解释的模糊不清。 NoiseGrad方法的独特之处在于它不是在输入数据上添加噪声，而是将随机性引入模型的权重。这一策略被称为“噪声扩散”，有助于减少解释的扩散，从而提供更清晰的决策路径。NoiseGrad是方法不可知的，意味着它可以应用于各种模型和网络架构，而不仅仅是特定的解释技术。 NoiseGrad++是NoiseGrad的一个扩展，它使用乘性高斯噪声进一步优化效果。通过一系列广泛的实验，包括不同数据集、解释方法和网络结构的测试，研究发现NoiseGrad++在多个评估标准上优于SmoothGrad，表明其在提高解释质量方面的显著优势。论文还探讨了NoiseGrad与贝叶斯学习的联系，为选择合适的超参数提供了启发式方法。这种联系揭示了噪声引入权重如何可以模拟贝叶斯后验分布，从而增加模型的不确定性理解和解释。这对于在医疗等高风险领域中负责任地使用人工智能至关重要。 NoiseGrad及其变体为改进深度学习模型的可解释性开辟了新的途径，不仅可能提高现有归因方法的效果，还有望促进未来在XAI领域的研究和发展。通过引入权重噪声， NoiseGrad为理解和信任复杂DNN的决策过程提供了更坚实的基础。

+v：mala2255获取更多论

文

≤

∞

- − ∞ −∞

NG++

我

输入

0.0

加速度：

98.07

0.2

加速度：

96.17

0.4

电话：

+86-

021 -

88888888

0.6

电话：

41.208

0.8

访问量：

11.477

图3：CMNIST数据集上NG增强的显着性解释的说明：当增加超参数σ直到σ

时，我们观察

到解释的定位能力有所提高

。

（

;

，

NG W

）

.通过在足够大数量的样本

上进行平均，我们期望NG来平滑信

号，并且还从决策边界接近测试样本的模型中收集放大的信号此外，为了将输入空间和模

型空间中的随机性结合起来，我们提出了NoiseGrad++作为NoiseGrad和SmoothGrad

N M

（

）

<$1<$

（

，

（

，

））

，

（

）

其中，

和

表示模型的数量和输入的噪声版本

分别在我们的实验中，NG++进一步提高了NG的性能，提供了最佳的定性和定量性能。

噪音水平。重要的问题是应该向权重添加多少噪声

我们是否需要根据给定的模型架构

或数据集来调整噪声水平？我们提出了一个简单的假设：由于我们需要来自决策边界接近

测试样本的模型的信号，我们可以选择噪声水平

，以便我们观察到一定的准确性下降。

根据实验结果（在补充材料中进行了更深入的讨论），我们建议将相对精度下降AD（σ）设

置

为

1 （ACC（σ）中国（））/（ACC（0）中国（其中ACC（σ）表示在噪声水

平σ下的分类准确度。注意，ACC（

）和ACC（）分别对应于原始精度和机会水平。这个

经验法则可以用于不同规模的各种模型架构，如5.2节所述。

实验

为了评估我们提出的方法，我们有兴趣比较的

属性质量

的NoiseGrad和NoiseGrad++的解释与

SmoothGrad产生的。为此，我们现在描述有关实证实验的细节，包括数据集，评估方法，

比较方法和模型。

4.1

数据集

为了衡量一个解释的好坏，人们通常需要求助于替代品进行评估，因为不存在解释的基础

事实与[21]和[22]类似，我们因此设计了一个受控设置，其中地面实况分割标签可用。为

此，我们构建了一个半自然的数据集CMNIST（自定义MNIST），其中每个MNIST数字[23]

显示在随机选择的CIFAR背景[24]上。为了确保类的可解释证据位于对象本身的附近，而不

是在其上下文环境中，我们一致地

剩余20页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

NoiseGrad：提升机器学习模型解释性的噪声引入方法

Improving Neural Language Modeling via Adversarial Training 引入噪声

从噪声数据进行关系分类的强化学习

SVM模型与LR模型的异同点

机器学习中的正则化是什么原理

机器学习中对正则化偏置项b的意义

深度学习相比机器学习的优势

使用sklearn相关模型的结果差异，说明差异原因。

bp神经网络预测模型优势

xgboost回归预测模型

机器学习回归算法，线性回归以及神经网络回归是什么 解释

最新资源

机器学习回归算法，线性回归以及神经网络回归是什么解释