Alpha+:一种利用有损分解增强数据隐私保护的方法

需积分: 0 1 下载量 131 浏览量 更新于2024-09-13 收藏 737KB PDF 举报
"基于有损分解的数据隐私保护方法通过改进(α, k)隐私保护模型,利用关系数据库的有损分解思想,旨在解决传统方法在数据隐私保护中信息损失大和聚集查询精度低的问题。该方法首先通过(α, k)生成匿名数据库,接着将匿名数据库分解为两个可连接的表NSS和SS,并利用它们之间的冗余信息来增强隐私保护。随后,Alpha+方法合并这两个表的元组以减小发布数据库的规模。实验结果显示,Alpha+在保持较高安全性的同时,提高了聚集查询的精度,优于同类方法。该研究由中山大学和香港中文大学的研究人员完成,并发表在《计算机研究与发展》期刊上。" 详细知识点说明: 1. 数据隐私保护:在数据挖掘中,隐私保护是确保个人或敏感信息不被未经授权的访问或滥用的关键技术。随着大数据和数据分析的普及,隐私保护变得越来越重要。 2. (α, k)隐私保护模型:这是一种用于数据匿名化的模型,它通过确保每个数据记录无法与特定个体关联(k-匿名)并且个体的敏感信息不易被推断(α-差异度)来保护隐私。 3. 有损分解:在关系数据库理论中,有损分解是指将一个关系分解成多个关系,过程中可能丢失部分信息。在这里,这种方法用于减少数据的敏感性,同时保留足够的信息用于分析。 4. 匿名数据库:通过去除或混淆直接或间接识别个体的信息,创建一个无法直接追踪到个人的数据库,是数据隐私保护的一种手段。 5. 可连接的数据库表:NSS和SS是经过有损分解后的两个数据库表,它们之间可以进行连接操作,这有助于在保护隐私的同时保持数据的关联性。 6. 冗余信息:在数据保护中,冗余信息被用来增加攻击者推断真实信息的难度,通过这种方式增强了数据的隐私性。 7. 元组合并:Alpha+方法通过合并NSS和SS表的元组,减少了最终发布的数据库大小,这有助于降低数据泄露的风险,同时保持查询性能。 8. 聚集查询精度:衡量数据处理算法在提供聚合统计信息(如总和、平均值等)时的准确性,Alpha+方法在此方面表现出优越性,能提供更准确的聚合查询结果。 9. 安全性比较:实验对比显示,Alpha+在保持数据隐私的同时,提供了更高的查询精度,优于其他类似方法,证明了其在数据隐私保护领域的有效性。 基于有损分解的数据隐私保护方法Alpha+是一种创新的数据匿名化策略,它通过优化(α, k)模型,提升了隐私保护的效果,同时保持了数据的实用性和查询性能,对于大数据环境下的隐私保护具有重要的理论和实践价值。