神经网络个体公平性证明与优化方法

62 浏览量更新于2024-06-19 收藏 2.07MB PDF 举报

“神经网络的个体公平性保证” 在当前的数字化时代，神经网络已经成为人工智能领域的核心工具，广泛应用于诸如决策支持、风险评估和推荐系统等场景。然而，随着它们的普及，也引发了对模型公平性的担忧。这篇论文深入探讨了前馈神经网络（NN）的个体公平性（Individual Fairness, IF）的证明问题，旨在确保模型的决策不会因个人的敏感属性（如种族、性别）而产生歧视。个体公平性概念由Dwork等人在2012年提出，它要求模型在所有与敏感属性无关的个体之间保持一致的决策行为。不同于群体公平性，个体公平性关注每个个体的具体情况，而不是整体统计特性，从而提供更严格的公平性保证。论文中提到的NN-δ-IF公式是实现这一目标的一种方式，它限制了任意两个NN相似个体之间的输出差异不超过一个最大决策容差δ0。论文中，作者使用马氏距离（Mahalanobis distance）等度量来衡量个体之间的相似性，并通过分段线性函数对神经网络的非线性全局行为进行上界和下界估计。他们将这个问题转化为混合线性规划问题，通过求解该问题可以计算出IF保证。这种方法被应用于四个常见的公平性基准数据集，展示了解决方案的有效性。为了在训练过程中进一步促进公平性，论文还提出了修改NN损失函数的方法，以鼓励模型学习公平的决策边界。实验结果表明，使用这种方法训练的神经网络在公平性和性能上都优于现有的最先进的技术。尽管个体公平性提供了更强的保障，但在实际应用中仍面临挑战，比如计算复杂性增加、可能牺牲模型的效率以及难以找到合适的相似性度量。此外，个体公平性的实施需要谨慎处理，因为它可能与模型的其他目标（如准确率或召回率）存在冲突。这篇论文为神经网络的公平性研究提供了新的理论框架和实用工具，对于理解并改进机器学习模型的公平性具有重要意义。它不仅为确保模型在敏感属性上的公平决策提供了理论基础，也为未来的研究和实践提供了指导。通过这样的工作，我们可以期望在未来的人工智能系统中看到更加公正和包容的决策过程。

+v：mala2277获取更多论

文

，

∞

（

）

，

（

）

≤

′

（

−

通过推导一组近似约束，

M MM

−

+ φ

（

一

）

（

）

PWL

，

PWL

，

图

：对于越来越多的分区点

（用红色刻度标记），将上下

PWL

函数转换为

sigmoid

。

引理3.1保证了我们可以使用PWL函数来约束非线性

激活函数。关键是，PWL函数可以被编码到MILP约束

中。

提案

设

（

）

，其中

l= 1

，

. . .

，

是二元变量，

（

）

∈

，

是连续变量

考虑

（

）

∈

附录A给出了命题2的证明，以及收敛速度的实验分

析。

我们注意到PWL界可用于所有常用的激活函数σ。唯

一的假设是σ在R的任何紧区间上有有限个拐点。对于收

敛性（Prop.2），我们重新-

[

（

）

，

（

）

]

，

则

推出了

（

）

（

）

。

（

）

意味着：

quire几乎处处连续可微，

j j j j

（

）

= 1

，

（

）

= 1

，

（

）

（

）

（

）

，

（

）

≤

通过常用的激活来满足

3.2

公平约束

，

l=1

，

在MILP中的公平性约束的编码用于-

（

）

（

）

，

（

）

，

（

）

≤

U_n

（

）

≤

（

）

仿真取决于度量D

公平

的具体形式。

，

l j

，

加权

度量

：加权

度量可以被

通过采用矩形近似区域。虽然这

证据可以在附录A中找到。命题1确保每个NN神经元

的全局行为可以通过使用2M辅助变量的5个线性约束利

用命题1，我们可以以合理的方式将等式（2）的模型约

束编码为MILP形式过逼近误差不依赖于MILP公式（其

是精确的），而是依赖于PWL边界，并且因此是可通过

选择网格点的数目M

来

控制的，并且在极限中变得精确

对于l度量是直接的，对于其余情况，可以使用区间抽象

[Dantzig，2016]。

Mahalanobis

度量

：我们首先计算

的正交分解为

SU=Λ

，其中

是

的特征向量矩阵，

是以

个特征

值为元素的对角矩阵考虑旋转变量

′

，

′′

=UTx

′′

，则我们得到方程（

）可以重写

当（

′

−

′′

）

（

′

−

′′

）≤

时，通过简单的代数，我

们有

对于每个

，（

′

−

′′

）

≤

。通过转换回

请注意，在ReLU激活函数的特定情况

我

原始变量，我们得到方程（3）可以超过-

假设过近似对任何M > 0都是精确的

。

近似为：

−

诊断

（Λ）

≤

′

−

′′

≤

是

的

诊断（Λ）

号提案

假设

（

）

是连续可微的

特征嵌入度量我们处理的情况下，

(i)

L （i）U

当

在

[

中

时，

，

]

，

除了可能在

有限

集合中。

则

PWL

引理

3.1

当

趋于无穷大时一致收敛于

（

）。

此外，定义

=（φ

（

）

）/M

，

则对于

的有限值，较低的误差（分别为，上）在凸（相应

地）中的边界凹）的

（

）

区域

，

在

度量定义中使用的，即

fair

（

′

，

′′

）

fair

（

′

，

′

），是一个

嵌入。这是直接的，因为对于模型

约束，可以将

MLP

编码到

MILP

3.3

总的制剂

∈

[

（

）

，

（

）]

]

由下式给

出

我们现在制定的 MILP 编码为过度-

，

l j

，

ΣΣ

）

−

′

（

）

近似

值

≥δmax。对于等式（2），我们

，

变量x

′

和x

′

′通过使用

第

3.1

节。我们将相应的变量表示为

′

（

）

，

和上部（分别地，下）凹（分别凸）区域：

分别为

′

（

）

和

′′

（

）

，

′′

（

）

。

在

′

上的最终输

出

- 是

的

（

）

≤

（

一

）

，

−

（

，

）

′

（

）

剩余20页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

神经网络个体公平性证明与优化方法

人工智能诊断中的神经网络.pptx

深度学习公平性：神经网络个体公平性验证与优化

神经网络个体公平性保障：理论与实践

前馈神经网络的个体公平性分析与保障技术

基于数据挖掘的许公平治疗咳嗽用药规律分析.pdf

网络刻画技巧的有关知识

图机器学习的公平性和解释性探究

GRM模型下的BP神经网络参数估计方法

Logit模型与神经网络在交通拥挤收费定价中的应用

艺术与科学：神经网络可解释性技术的深度剖析

最新资源