深度学习公平性：神经网络个体公平性验证与优化

37 浏览量更新于2024-06-16 收藏 2.07MB PDF 举报

"神经网络个体公平性证明方法" 在当今数据驱动的世界中，神经网络(NN)已经成为许多关键领域的核心技术，如金融、医疗和司法。然而，随着它们的广泛应用，公平性问题日益突出，因为神经网络有可能在决策过程中放大社会偏见。这篇论文专注于神经网络的个体公平性(Individual Fairness, IF)，这是公平性研究的一个重要分支，旨在确保模型对每个个体都公平，而不仅仅是对群体。论文提出了一种名为NN-δ-IF的公式，该公式针对前馈神经网络，要求在给定的最大决策容差δ0内，对任何两个被认为是NN-相似的个体，其输出差异应受到限制。这里的相似性度量是通过学习从数据中得到的，比如用Mahalanobis距离来衡量个体间的差异。为了实现NN-δ-IF的证明，论文提出了一种方法，通过分段线性函数来近似神经网络的非线性全局行为。这一过程被编码为一个混合线性规划问题，可以有效地求解。作者展示了这种方法在四个广泛使用的公平性基准数据集上的应用，用于计算个体公平性保证。此外，论文还探讨了如何在训练阶段通过调整神经网络的损失函数来促进公平性。实验结果显示，这种方法产生的模型相比现有的最先进的技术，具有更高的个体公平性表现。个体公平性的研究不仅仅是一个理论概念，它对消除模型中的潜在偏见和提高模型的社会接受度至关重要。尽管群体公平性考虑了模型的整体统计特性，但它不能保证个体层面的公平。相反，个体公平性提供了每个个体的具体保障，确保在所有可能的输入情况下，模型的决策不会因个体的敏感属性（如种族、性别等）而产生不公正的差异。这篇论文为神经网络的个体公平性证明提供了一个新的框架，为构建更加公平的机器学习模型开辟了道路。通过理论分析与实证研究的结合，作者展示了一种有效的方法来量化和增强NN的个体公平性，这对于未来的研究和实践具有深远的影响。

+v：mala2277获取更多论

文

，

∞

（

）

，

（

）

≤

′

（

−

通过推导一组近似约束，

M MM

−

+ φ

（

一

）

（

）

下

一

页

PWL

，

PWL

，

图

：对于越来越多的分区点

（用红色刻度标记），将上下

PWL

函数转换为

sigmoid

。

引理3.1保证了我们可以使用PWL函数来约束非线性

激活函数。关键是，PWL函数可以被编码到MILP约束

中。

提案

设

（

）

，其中

l= 1

，

. . .

，

是二元变量，

（

）

∈

，

是连续变量

考虑

（

）

∈

附录A给出了命题2的证明，以及收敛速度的实验分

析。

我们注意到PWL界可用于所有常用的激活函数σ。唯

一的假设是σ在R的任何紧区间上有有限个拐点。对于收

敛性（Prop.2），我们重新-

[

（

）

，

（

）

]

，

则

推出了

（

）

（

）

。

（

）

意味着：

quire几乎处处连续可微，

j j j j

（

）

= 1

，

（

）

= 1

，

（

）

（

）

（

）

，

（

）

≤

通过常用的激活来满足

3.2

公平约束

，

l=1

，

在MILP中的公平性约束的编码用于-

（

）

（

）

，

（

）

，

（

）

≤

U_n

（

）

≤

（

）

仿真取决于度量D

公平

的具体形式。

，

l j

，

加权

度量

：加权

度量可以被

通过采用矩形近似区域。虽然这

证据可以在附录A中找到。命题1确保每个NN神经元

的全局行为可以通过使用2M辅助变量的5个线性约束利

用命题1，我们可以以合理的方式将等式（2）的模型约

束编码为MILP形式过逼近误差不依赖于MILP公式（其

是精确的），而是依赖于PWL边界，并且因此是可通过

选择网格点的数目M

来

控制的，并且在极限中变得精确

对于l度量是直接的，对于其余情况，可以使用区间抽象

[Dantzig，2016]。

Mahalanobis

度量

：我们首先计算

的正交分解为

SU=Λ

，其中

是

的特征向量矩阵，

是以

个特征

值为元素的对角矩阵考虑旋转变量

′

，

′′

=UTx

′′

，则我们得到方程（

）可以重写

当（

′

−

′′

）

（

′

−

′′

）≤

时，通过简单的代数，我

们有

对于每个

，（

′

−

′′

）

≤

。通过转换回

请注意，在ReLU激活函数的特定情况

我

原始变量，我们得到方程（3）可以超过-

假设过近似对任何M > 0都是精确的

。

近似为：

−

诊断

（Λ）

≤

′

−

′′

≤

是

的

诊断（Λ）

号提案

假设

（

）

是连续可微的

特征嵌入度量我们处理的情况下，

(i)

L （i）U

当

在

[

中

时，

，

]

，

除了可能在

有限

集合中。

则

PWL

引理

3.1

当

趋于无穷大时一致收敛于

（

）。

此外，定义

=（φ

（

）

）/M

，

则对于

的有限值，较低的误差（分别为，上）在凸（相应

地）中的边界凹）的

（

）

区域

，

在

度量定义中使用的，即

fair

（

′

，

′′

）

fair

（

′

，

′

），是一个

嵌入。这是直接的，因为对于模型

约束，可以将

MLP

编码到

MILP

3.3

总的制剂

∈

[

（

）

，

（

）]

]

由下式给

出

我们现在制定的 MILP 编码为过度-

，

l j

，

ΣΣ

）

−

′

（

）

近似

值

≥δmax。对于等式（2），我们

，

变量x

′

和x

′

′通过使用

第

3.1

节。我们将相应的变量表示为

′

（

）

，

和上部（分别地，下）凹（分别凸）区域：

分别为

′

（

）

和

′′

（

）

，

′′

（

）

。

在

′

上的最终输

出

- 是

的

（

）

≤

（

一

）

，

−

（

，

）

′

（

）

剩余20页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

深度学习公平性：神经网络个体公平性验证与优化

基于机器学习的基因组微卫星状态探测方法综述.pdf

ORL 人脸数据库（40个人，每个人10幅图像）

基于深度学习的人脸安全认证：现状与挑战.pdf

神经网络鲁棒性的形式化验证

hopfield神经网络的同步性研究现状

交叉验证优化BP神经网络

神经网络怎么注意一个个体

如何用神经网络方法处理小波系数

神经网络和其他数据驱动方法的去呗

遗传算法神经网络优化

最新资源