差分隐私流式直方图发布:提升数据流环境下的可用性和精度

1 下载量 178 浏览量 更新于2024-08-26 收藏 550KB PDF 举报
本文主要探讨了"基于差分隐私的流式直方图发布方法"这一主题,针对的是在数据流环境下,如何有效地保护用户隐私并提供准确的数据发布。传统的差分隐私保护模型主要关注静态数据集,但在实时的数据流处理中,如在线分析或监控系统,直接应用这些方法往往存在诸多问题,比如发布的直方图可用性降低和发布误差较大。 作者张啸剑和孟小峰针对这一挑战,提出了一个创新的方法——滑动窗口直方图发布算法(SHP,Streaming Histogram Publication)。SHP通过将数据流划分为一系列连续的滑动窗口,并对每个窗口内的桶计数进行分组处理。他们注意到数据流的动态特性,因此设计了三种不同的拉普拉斯噪声添加机制来确保差分隐私: 1. 滑动窗口机制:通过对每个窗口内的计数独立添加噪声,以确保不同窗口之间的数据不直接关联,从而保护个体隐私。 2. 时间点机制:在特定的时间点上添加噪声,这种方法更加注重对关键时间点的保护,但可能会牺牲一些实时性。 3. 自适应抽样机制:这是最具创新性的部分,SHP算法会预测下一个时间点的计数,并仅当预测值与真实值差异小于预设阈值时发布预测值,否则发布噪声值。这种自适应策略有助于节省隐私预算,提高数据发布的精度。 实验结果表明,采用自适应抽样的SHP算法在保持隐私的同时,显著提高了直方图发布的可用性和准确性,相比于滑动窗口和时间点机制,其性能更优。本文的研究对于理解和改进数据流环境下的隐私保护技术具有重要意义,适用于诸如在线统计分析、实时监控和大数据挖掘等领域。此外,文章遵循了《软件学报》的版权要求,并提供了详细的引用格式,以便学术界进一步阅读和研究。