全同态密码驱动的联邦学习新突破:隐私保护与进展

版权申诉
0 下载量 61 浏览量 更新于2024-07-05 收藏 1.04MB PDF 举报
"5-4+全同态密码:联邦学习的新方式" 是一篇关于在2021年的DataFunSummit会议上讨论的前沿技术主题。该研讨会重点关注了联邦学习(Federated Learning),这是一种分布式机器学习方法,旨在在保护用户隐私的同时,在大量设备或数据持有者的本地进行模型训练。演讲者陆文杰,拥有暨南大学本科和日本筑波大学博士学位,专攻全同态密码的应用,这是一种特殊的加密技术,允许在加密数据上进行计算而无需解密。 联邦学习的核心在于利用每个数据持有者(DO)的本地数据来构建一个全局模型,而不会泄露原始数据。在这个过程中,DOs计算并发送局部梯度到Parameter Server (PS),PS汇总这些梯度以更新全局模型。这种方法关注的是通信效率、模型收敛速度和鲁棒性,尤其是在特征相同但数据集不同的情况下,比如逻辑回归模型的训练,可以看作是数据库水平分割的类比。 然而,数据隐私是联邦学习中的关键挑战。会议讨论了三个核心问题:首先,确定哪些信息可以被收集和交换,如局部梯度被允许分享,而原始数据必须保持在本地。其次,讨论哪些中间结果可以公开,是允许PS获取每个DO的局部梯度,还是仅限于全局梯度。最后,探讨如何确保这些信息的交换过程是安全的,即如何设计有效的协议来保护数据隐私。 全同态密码在此背景下扮演了重要角色,因为它提供了在加密状态下执行计算的能力,这意味着在保护数据隐私的同时,DOs可以在自己的数据上进行计算而不暴露敏感信息。通过巧妙地结合全同态密码和其他隐私保护技术,研究者们正在探索联邦学习的新方法,以实现更高效且隐私友好的协作式学习。 这篇论文和演讲探讨了联邦学习如何借助全同态密码这一创新技术来提高隐私保护水平,同时优化通信和计算效率,这对于推动未来在大型分布式系统中实施隐私保护的机器学习应用具有重要意义。"