2017 SecureML:隐私保护机器学习的高效系统与突破

需积分: 48 12 下载量 88 浏览量 更新于2024-07-17 收藏 1.15MB PPTX 举报
"SecureML: A Scalable Privacy-Preserving Machine Learning System" 在2017年的SecureML研究中,作者Payman Mohassel和Yupeng Zhang提出了一种创新的系统,旨在解决大规模数据隐私保护下的机器学习问题。随着数据量的增长,如图像处理、语音识别、游戏(如围棋)中的应用,对更好模型的需求也随之提升。然而,数据隐私问题成为了一个关键挑战,特别是在涉及敏感信息的场景,如欺诈检测。 SecureML关注的是在保护用户隐私的前提下进行机器学习。具体来说,它采用了两服务器模型,即一个服务器作为数据托管者,另一个服务器执行两方计算(Two-party Computation),使得用户的数据在整个过程中无需直接暴露。这种方法比多方计算(Multi-party Computation, MPC)和同态加密(Homomorphic Encryption, FHE)更高效,允许用户在训练期间离线,提高了系统的灵活性。 SecureML的研究重点在于开发新的协议,特别是在线性回归、逻辑回归和神经网络的训练方面。它利用了秘密共享技术(Secret Sharing)和预先计算的三元组(Precomputed Triplets),结合了 garbled circuit技术,显著提高了计算效率。与先前的工作相比,SecureML在执行这些机器学习任务时,速度提升达到54到1270倍,这在处理大规模数据集上尤为显著,例如100万条记录和5000个特征的逻辑回归案例。 该系统的优势在于能够扩展至大型数据集,并且在确保数据隐私的同时,仍保持了高效的学习能力。SecureML的成功体现在其在多个先前工作(如[NWI+13, NIW+13, GSB+16]等)中被广泛应用,证明了其在实际场景中的实用性。通过SecureML,研究人员能够在满足隐私需求的同时,继续推动机器学习技术的进步,这对于数据驱动的时代具有重要意义。"