蚂蚁发起的隐私计算框架SecretFlow:数据智能与机器学习的新选择

1 下载量 163 浏览量 更新于2024-11-22 收藏 23.44MB ZIP 举报
资源摘要信息:"隐语 SecretFlow 是由蚂蚁集团发起并推出的隐私计算通用框架,旨在提供一个统一的平台以保护数据隐私的前提下进行智能数据处理和机器学习任务。作为一个通用框架,SecretFlow 包含多个层次,从设备抽象层到应用层,每层都旨在解决特定的隐私计算挑战。 在设备抽象层,SecretFlow 提供了明文设备和密态设备两种类型的设备抽象。明文设备用于处理未加密的数据,而密态设备则是封装了不同隐私保护协议的设备,如同态加密、秘密共享等。这样的设计允许数据科学家和机器学习工程师能够在一个统一的框架下进行开发,而无需深入了解各种隐私保护技术的具体实现。 设备流层将高级的算法任务转换为设备对象流和数据流图(DAG),从而实现算法的自动化和并行化。算法层专注于数据分析和机器学习,支持使用水平或垂直分区的数据进行隐私保护的数据分析和机器学习模型训练。水平分区指的是数据集被分割成不同的子集,并分别存储在不同的参与方处;而垂直分区则是不同的特征集分布在不同的参与方处。这两种分区方法都是隐私计算中常见的数据分片技术。 工作流层是 SecretFlow 框架中的高级组件,它将数据处理、模型训练和超参数调整等任务无缝集成起来,形成一个完整的机器学习工作流。通过这种方式,可以简化隐私保护机器学习流程的复杂度,使得用户能够更加专注于业务逻辑的实现。 Kuscia 是 SecretFlow 中的一个组件,它是一个基于 K3s 的轻量级隐私计算任务编排框架。K3s 是一个轻量级的 Kubernetes 发行版,用于简化容器化应用的部署和管理。Kuscia 利用 K3s 的优势,提供了任务编排功能,可用来管理复杂的隐私计算任务和实验。 SCQL(Secure Collaborative Query Language)是 SecretFlow 中的一个子系统,它支持多个不信任方在不泄露各自私有数据的前提下进行联合数据分析。通过 SCQL,各方可以共同构建查询,并在保持各自数据隐私的同时得到查询结果。 SPU(Secure Processing Unit)是 SecretFlow 中的一种安全计算设备,它提供计算能力的同时保证数据隐私。SPU 采用硬件级别的安全技术,为隐私计算提供安全保障。 HEU(Homomorphic Encryption Utility)是一个高性能的同态加密算法库。同态加密技术允许数据在加密状态下进行计算,计算结果解密后与明文数据执行相同操作的结果相同。这一特性使得 HEU 在隐私计算领域尤为重要。 YACL(Yet Another C++ Library)是 SecretFlow 代码所依赖的基础库,它包含密码学、网络通信和 I/O 等模块。这些底层的模块支持整个 SecretFlow 框架的运行,并为上层应用提供必要的基础服务。 隐语 SecretFlow 的目标是为数据科学家、机器学习工程师以及隐私计算研究者提供一个强大的工具集,以应对日益增长的隐私保护需求。在当今这个数据安全和隐私日益受到重视的时代,SecretFlow 正在成为一个重要的隐私计算框架,其支持者和用户群体也在不断增长。"