深度学习中的种族偏见:RFW数据集与IMAN算法

PDF格式 | 2.44MB | 更新于2025-01-16 | 189 浏览量 | 0 下载量 举报
收藏
本文主要关注的是深度人脸识别领域中的一个重要问题——种族偏见。作者首先构建了一个名为"野生动物的面孔:RacialFacesintheWild (RFW)"的数据集,这个专门设计的数据库旨在公正地评估深度人脸识别技术中的种族不平等现象。通过对包括四种商业API和四种最先进的算法进行深入分析,研究发现这些系统在处理非洲裔面孔时的错误率显著高于白人面孔,显示出明显的种族偏见。 为了解决这个问题,文章提出了一种深度无监督域自适应的方法,即深度信息最大化自适应网络(IMAN)。IMAN的核心思想是通过将欧洲人脸(如白人)作为源域,其他种族作为目标域,实现跨种族间的特征学习。该方法不仅关注全局差异的减小,以缩小不同种族间的性能差距,还注重在集群级别学习无歧视的目标表示,通过一种新的互信信息损失函数增强网络在无标签数据上的区分能力。 为了进一步验证IMAN的有效性,实验在RFW、GBU和IJB-A等多个数据集上进行,结果显示IMAN能够成功学习到具有跨种族和跨数据库良好泛化能力的特征。此外,作者还强调了训练数据的平衡性对降低种族偏见的重要性,通过收集种族平衡的训练数据库,证明了种族偏见不仅源于算法,也与数据本身的选择有关。 本文对深度人脸识别中的种族偏见进行了深入探讨,提供了新的数据集和算法策略,对于推动公平、无偏的生物识别技术发展具有重要意义。未来的研究可能会围绕如何优化模型设计、改进数据采集策略以及开发更具包容性的评估标准来继续探索这一议题。

相关推荐