隐私保护KMeans聚类:Practical Privacy Preserving KMeans算法
需积分: 5 40 浏览量
更新于2024-06-26
收藏 976KB PDF 举报
"这篇论文‘Practical Privacy Preserving KMeans’由Payman Mohassel,Mike Rosulek和Ni Trieu在2020年的密码学会议PETS上发表,提出了一种实用的隐私保护双方KMeans聚类算法。该算法利用密码学技术,如不经意传输、函数秘密分享和混淆电路,来在保护数据隐私的同时进行聚类分析。论文还提供了开源代码,便于读者理解和实现这一方法。"
在数据科学领域,聚类是一种常用的数据分析技术,用于将相似的数据分组。KMeans是最流行的聚类算法之一,它通过迭代优化过程,将数据点分配到最近的聚类中心,从而形成不同的群组。然而,当数据来自多个不同源时,保护每个数据库的隐私变得至关重要。论文“Practical Privacy Preserving KMeans”针对这一问题进行了研究,将KMeans算法转换为一种隐私保护的形式。
为了构建这个隐私保护的聚类算法,作者首先提出了一种高效的批量欧几里得平方距离计算协议,适用于需要计算一个点与多个点之间距离的情况。这种协议在 amortizing 设置下运行,即通过一次计算处理多个数据点,提高了效率。此外,他们还设计了一个定制的混淆电路,用于在共享值中计算最小值,这是KMeans算法中确定最近聚类中心的关键步骤。
论文的实现和评估部分展示了这些协议的实用性,证明它们能够在保持高精度的同时,处理比之前工作更大的数据集,并且速度更快。数值结果显示,提出的协议几乎能达到与非隐私保护KMeans算法相同的准确性,这表明在保护隐私的同时,算法的性能并未显著降低。
这篇论文为隐私保护的聚类分析提供了一个实际可行的解决方案,其贡献不仅在于新的KMeans算法实现,还包括提出的批量距离计算协议和最小值共享电路,这些可能独立于本工作具有广泛的适用性。对于关注数据隐私和安全性的研究人员以及毕业设计的学生来说,这是一个非常有价值的参考资源。
1171 浏览量
206 浏览量
基于加权密度与最大最小距离的Kmeans聚类算法优化研究:离群点干扰降低与全局最优避免的实践,基于加权密度与最大最小距离的Kmeans聚类算法:优化初始中心选择与避免局部最优的实践,P33、基于加权密
2025-03-02 上传
961 浏览量
1081 浏览量
5023 浏览量
312 浏览量
180 浏览量
2615 浏览量


不是AI
- 粉丝: 2906
最新资源
- 隐私数据清洗工具Java代码实践教程
- UML与.NET设计模式详细教程
- 多技术领域综合企业官网开发源代码包及使用指南
- C++实现简易HTTP服务端及文件处理
- 深入解析iOS TextKit图文混排技术
- Android设备间Wifi文件传输功能的实现
- ExcellenceSoft热键工具:自定义Windows快捷操作
- Ubuntu上通过脚本安装Deezer Desktop非官方指南
- CAD2007安装教程与工具包下载指南
- 如何利用Box平台和API实现代码段示例
- 揭秘SSH项目源码:实用性强,助力开发高效
- ECSHOP仿68ecshop模板开发中心:适用于2.7.3版本
- VS2012自定义图标教程与技巧
- Android新库Quiet:利用扬声器实现数据传递
- Delphi实现HTTP断点续传下载技术源码解析
- 实时情绪分析助力品牌提升与趋势追踪:交互式Web应用程序