Multi-RPHM：高维数据的本地差分隐私收集算法

171 浏览量更新于2024-08-28 收藏 1.6MB PDF 举报

"该文提出了一种名为Multi-RPHM的基于随机投影的本地差分隐私高维数值型数据收集算法，旨在解决在保护用户隐私的同时，高效收集高维数值数据的问题。通过理论分析和实验验证，该算法满足ε-本地差分隐私，并能保证数据的高效利用。" 在当前大数据时代，隐私保护成为了重要议题，特别是在数据收集过程中。本地差分隐私（Local Differential Privacy, LDP）是一种严格的隐私保护模型，它确保单个用户的贡献无法被识别，从而保护个人信息。对于高维数值型数据，由于数据维度高，直接应用LDP可能会导致数据失真严重，影响数据分析的准确性。因此，设计一种既能保证隐私又能保持数据效用的算法至关重要。 Multi-RPHM算法利用随机投影技术来降低数据的维度，从而减轻高维数据处理中的隐私泄露风险。随机投影是一种降维方法，通过将高维数据映射到一个低维空间，可以减少数据之间的相互依赖性，同时保持原始数据的主要结构。在Multi-RPHM中，这一过程结合了LDP机制，确保在数据投影过程中，每个用户的贡献被噪声充分模糊，使得即使在低维空间中，也无法准确追踪到特定用户的原始信息。 ε-本地差分隐私是LDP的一种度量标准，ε值越小，隐私保护程度越高。文章中提到，Multi-RPHM算法被证明在数学上满足ε-本地差分隐私，这意味着在给定的ε值下，算法对用户数据的任何单一观测都不会显著改变发布结果的概率，从而有效地保护了用户的隐私。实验部分，研究者在合成数据集上测试了Multi-RPHM算法，结果显示，尽管进行了隐私保护，算法仍能保持收集数据的有用性，这对于实际应用中的数据挖掘和分析具有重要意义。这表明，Multi-RPHM算法能够在保护用户隐私的同时，为数据分析提供足够质量的信息。该研究为高维数值型数据的隐私保护提供了新的解决方案，其提出的Multi-RPHM算法在隐私保护和数据效用之间找到了一个平衡点，为未来大数据环境下的隐私保护策略设计提供了参考。

TOPIC 专题 3

一种基于随机投影的本地差分

隐私高维数值型数据收集算法

孙慧中，杨健宇，程祥，苏森

北京邮电大学网络与交换技术国家重点实验室，北京 100876

摘要

对满足本地差分隐私的高维数值型数据收集问题进行了研究。设计了一种基于随机投影技术的满足本地差分

隐私的高维数值型数据收集算法Ｍｕｌｔｉ－ＲＰＨＭ，在满足本地差分隐私的条件下，该算法处理维度较高的数据

时能够保证所收集的数据的高效用。从理论上证明了该算法满足ε－本地差分隐私的要求。在合成数据集上进

行的实验结果验证了该算法的有效性。

关键词

高维数值型数据；隐私保护；本地差分隐私；随机投影

中图分类号：ＴＰ３０９　　　　　　　　　　　　　　　　　　　文献标识码：Ａ　　　　　　　　　　　　　　　　

doi: 10.11959/j.issn.2096-0271.2020001

A high-dimensional numeric data collection

algorithm for local difference privacy based

on random projection

Abstract

The problem of high-dimensional data collection satisfying local differential privacy was studied. A new locally

differentially private algorithm called Multi-RPHM was proposed based on the random projection technology, which

achieved the high utility of the collected high-dimensional numeric data while satisfying the local differential privacy.

The algorithm was formally proved to meet ε-local differential privacy. The effectiveness of the algorithm was comfirmed

through experiments on synthetic datasets.

Key words

high-dimensional numeric data, privacy protection, local differential privacy, random projection

SUN Huizhong, YANG Jianyu, CHENG Xiang, SU Sen

State Key Laboratory of Networking and Switching Technology, Beijing University of Posts and

Telecommunications, Beijing 100876, China

2020001-1

下载后可阅读完整内容，剩余8页未读，立即下载

weixin_38637878

粉丝: 3
资源: 926

Multi-RPHM：高维数据的本地差分隐私收集算法

一种基于随机投影的本地差分隐私高维数值型数据收集算法.docx

基于大数据技术的本地差分隐私高维数据收集算法.pdf

掌握核心Python数据挖掘算法：精通数据科学的关键步骤

【数据挖掘算法原理入门】：掌握算法核心，0基础也能开始！

【数据挖掘算法的数学原理】：不懂数学也能懂？深入浅出算法基础

MATLAB标准差计算进阶：掌握高级技巧和算法

【AI算法的数据预处理艺术】：提升算法性能的秘诀全揭秘

数据挖掘黄金法则：人工智能算法的关键角色解析

【数据预处理的重要性】：为算法性能优化打下基础

【数据预处理与聚类】：Python先验知识，解锁算法潜力

最新资源