同态加密下的多分类Logistic回归模型:保护数据隐私的新方法

需积分: 4 1 下载量 168 浏览量 更新于2024-08-04 收藏 725KB PDF 举报
"这篇文档是《密码学报》2020年的一篇文章,由许心炜、蔡斌、向宏和桑军等人撰写,主要探讨了如何利用同态加密技术构建一个保护数据隐私的多分类Logistic回归模型。文章介绍了同态加密在数据安全外包中的应用,并基于Cheon等人提出的HEAAN(Homomorphic Encryption for Arithmetic of Approximate Numbers)同态加密方案,设计了一个适用于多分类问题的模型。该模型通过‘一对其余’的拆解策略,将二分类Logistic回归扩展到多分类场景。实验在UCI的Dermatology和Iris数据集上进行,结果显示模型具有良好的训练效率和预测准确性。" 本文详细阐述了在当前计算能力提升背景下,机器学习广泛应用的同时,数据安全的重要性日益凸显。同态加密技术作为一种创新的解决方案,可以在保持数据密文状态时进行计算,解密后的结果与明文计算一致,从而保证了数据隐私。作者选择HEAAN作为基础,是因为HEAAN是一种支持近似数值计算的同态加密方案,适合于处理非精确的机器学习算法,如Logistic回归。 文章的重点在于如何构建多分类Logistic回归模型。作者提出了一个策略,即对每个类别,都训练一个二分类Logistic回归模型,将其余类别视为负类,这样通过组合多个分类器的结果,可以实现对多分类问题的预测。这种方法巧妙地利用了二分类模型的性质,解决了多分类任务中的隐私保护问题。 实验部分,研究者使用了两个公开的UCI数据集——Dermatology和Iris。Dermatology数据集包含358个样本,34个特征,分为6个类别。经过加密训练,模型在约36.70分钟内完成训练,且准确率达到77.18%,与明文计算的准确率相当。这些实验结果证实了该模型在实际应用中的可行性和效率。 这篇文章提供了基于同态加密的多分类Logistic回归模型的一个实用框架,为数据敏感的机器学习任务提供了一种安全的处理方式。通过HEAAN加密技术,模型能够在保护数据隐私的同时,实现有效的训练和预测,对于进一步的研究和实际应用具有重要的参考价值。