K-匿名模型中不确定性数据的新型建模方法

9 浏览量更新于2024-08-27 收藏 588KB PDF 举报

该文研究了K-匿名隐私保护模型中不确定性数据的建模问题，提出了新的建模方法，包括Kattr、Ktuple、Kupperlower和Ktree模型，并探讨了模型空间的完备性和封闭性。在信息技术领域，数据隐私保护是至关重要的，尤其是在大数据时代。K-匿名模型是一种广泛使用的隐私保护技术，它通过将个人数据进行泛化处理，使得每个数据实例无法被唯一识别，从而达到保护个人隐私的目的。然而，当数据包含不确定性时，传统的K-匿名模型需要进行调整以适应这种特殊情况。不确定性数据管理是数据处理的重要组成部分，特别是在处理模糊、不精确或存在多源信息的数据时。在K-匿名模型中，不确定性源于人为泛化过程，即经过泛化的每个数据实例在原始数据中的映射概率是均等的。因此，传统的处理非人为不确定性数据的方法不再适用。为了应对这一挑战，该文提出了一套新的建模策略。首先，Kattr模型利用attribute-ors方法来描述K-匿名数据中准标识符属性值的不确定性，这允许表示同一属性可能存在的多个值。其次，Ktuple模型视K-匿名表中的不确定属性值为关系值，并采用tuple-ors方法进行描述，捕捉数据的关联不确定性。接着，Kupperlower模型将泛化值的范围分为上限和下限两个字段，提供了更精细的不确定性表示。最后，Ktree模型基于K-匿名表是由普通表通过泛化树生成的事实，反向拆解为树形结构，有助于理解和操作这些数据。这四种模型以及它们的不同组合构建了一个模型空间，用于全面描述K-匿名隐私保护模型中的不确定性数据。作者还深入讨论了这个模型空间的性质，如完备性和封闭性，这关系到模型的覆盖率和表达能力，确保了对所有可能的不确定性情况都能有效地建模。这篇研究为K-匿名隐私保护模型中的不确定性数据提供了一种系统性的建模框架，增强了模型的适应性和准确性，对于隐私保护和数据管理领域具有重要的理论和实践价值。

ＣＮ４３—１２５８／ＴＰ

ＩＳＳＮ

１００７—１３０Ｘ

计算机工程与科学

ＣＯＭＰＵＴＥＲ

ＥＮＧＩＮＥＥＲＩＮＧ＆ＳＣＩＥＮＣＥ

２０１１年第３３卷第９期

Ｖ０１．３３，Ｎｏ．９．２０１１

文章编号：１００７—１３０Ｘ（２０１

１）０９—０００７－０６

Ｋ一匿名隐私保护模型中

不确定性数据的建模问题研究。

Ｍｏｄｅｌｉｎｇ

ｔｈｅ

Ｕｎｃｅｒｔａｉｎ

Ｄａｔａ

ｉｎ

ｔｈｅ

Ｋ＿—Ａｎｏｎｙｍｉｔｙ

Ｐｒｉｖａｃｙ

Ｐｒｏｔｅｃｔｉｏｎ

Ｍｏｄｅｌ

吴佳伟。刘国华。王梅

ＷＵ

Ｊｉａ－ｗｅｉ，ＬＩＵ

Ｇｕｏ－ｈｕａ。ＷＡＮＧ

Ｍｅｉ

（东华大学计算机学院。上海２０１６２０）

（Ｓｃｈｏｏｌ

ｏｆ

Ｃｏｍｐｕｔｅｒ

Ｓｃｉｅｎｃｅ

ａｎｄ

Ｔｅｃｈｎｏｌｏｇｙ，Ｄｏｎｇｈｕａ

Ｕｎｉｖｅｒｓｉｔｙ，Ｓｈａｎｇｈａｉ

２０１６２０，Ｃｈｉｎａ）

摘

要：建模是不确定性数据管理的基础，Ｋ一匿名隐私保护模型中不确定性数据有其特殊性：它是人

为泛化后的不确定性数据，泛化后的每个实例还原成泛化前元组的概率是相等的。由于其特殊性，以往针

对非人为造成不确定性的数据建模方法已经不能简单地用于描述Ｋ一匿名隐私保护模型中不确定性数据。

为了描述Ｋ一匿名隐私保护模型中不确定性数据，本文提出几种针对它的新建模方法：Ｋ。，模型使用ａｔｔｒｉｂ—

ｕｔｅ—ｏｒｓ方法来描述Ｋ一匿名数据中准标识符属性值的不确定性；Ｋ。一。模型把Ｋ一匿名表不确定属性值看成

是一个关系值，对关系值使用ｔｕｐｌｅ－ｏｒｓ方法来描述；Ｋ。睢。。。，模型把Ｋ一匿名表泛化值范围分开成两个字

段：上限和下限；Ｋ。。模型根据Ｋ一匿名表是对普通表通过泛化树泛化而形成这一特性逆向拆分成树形结

构。由这几种模型及它们之间的组合构成了一个描述Ｋ一匿名隐私保护模型中不确定性数据的模型空间。

并且，本文讨论了模型空间里各种模型的完备性和封闭性等性质。

Ａｂｓｔｒａｃｔ．Ｍｏｄｅｌｉｎｇ

ｉｓ

ｔｈｅ

ｂａｓｉｓ

ｆｏｒ

ｔｈｅ

ｄａｔａ

ｍａｎａｇｅｍｅｎｔ

ｏｆ

ｕｎｃｅｒｔａｉｎｔｙ．Ｔｈｅ

ｓｐｅｃｉｆｉｃｉｔｙ

ｉｎ

ｔｈｅ

ｕｎｃｅｒ—

ｔａｉｎｔｙ

ｏｆ

ｔｈｅ

ｄａｔａ

ｉｎ

ｔｈｅ

ｋ－ａｎｏｎｙｍｉｔｙ

ｐｒｉｖａｃｙ

ｐｒｏｔｅｃｔｉｏｎ

ｍｏｄｅｌ

ｉｓ

ｆｏｕｎｄ，ｎａｍｅｌｙ，ｉｔｓ

ｕｎｃｅｒｔａｉｎｔｙ

ｉｓ

ｃａｕｓｅｄ

ｂｙ

ａｒｔｉｆｉｃｉａｌ

ｇｅｎｅｒａｌｉｚａｔｉｏｎ，ａｎｄ

ｔｈｅ

ｐｒｏｂａｂｉｌｉｔｙ

ｔｈａｔ

ｅａｃｈ

ｉｎｓｔａｎｃｅ

ｉｓ

ｒｅｄｕｃｅｄ

ａｆｔｅｒ

ｇｅｎｅｒａｌｉｚａｔｉｏｎ

ｔｏ

ｔｈｅ

Ｏ—

ｒｉｇｉｎａｌ

ｔｕｐｌｅ

ｉｓ

ｅｑｕａｌ．Ｂｅｃａｕｓｅ

ｏｆ

ｉｔｓ

ｓｐｅｃｉｆｉｃｉｔｙ，ｔｈｅ

ｐａｓｔ

ｍｏｄｅｌｉｎｇ

ａｐｐｒｏａｃｈｅｓ

ｏｆ

ｕｎｃｅｒｔａｉｎｔｙ

ｄａｔａ

ａｒｅ

ｎｏｔ

ｓｕｉｔａｂｌｅ

ｆｏｒ

ｔｈｅ

ｕｎｃｅｒｔａｉｎｔｙ

ｄａｔａ

ｉｎ

ｔｈｅ

ｋ—ａｎｏｎｙｍｉｔｙ

ｐｒｉｖａｃｙ

ｐｒｏｔｅｃｔｉｏｎ

ｍｏｄｅｌ

ｓｉｍｐｌｙ．Ｉｎ

ｏｒｄｅｒ

ｔｏ

ｄｅｓｃｒｉｂｅ

ｕｎｃｅｒｔａｉｎｔｙ

ｄａｔａ

ｉｎ

ｔｈｅ

ｋ—ａｎｏｎｙｍｉｔｙ

ｐｒｉｖａｃｙ

ｐｒｏｔｅｃｔｉｏｎ

ｍｏｄｅｌ．ｓｅｖｅｒａｌ

ｎｅｗ

ｍｏｄｅｌｉｎｇ

ｍｅｔｈｏｄｓ

ａｒｅ

ｐｒｏ—

ｐｏｓｅｄ

ｉｎ

ｔｈｉｓ

ｐａｐｅｒ：ｔｈｅ

Ｋ。ｔＩｒ

ｍｏｄｅｌ

ｕｓｅｓ

ｔｈｅ

ａｔｔｒｉｂｕｔｅ－ｏｒｓ

ｗａｙｓ

ｔｏ

ｄｅｓｃｒｉｂｅ

ｔｈｅ

ｕｎｃｅｒｔａｉｎｔｙ

ｉｎ

ｔｈｅ

ｑｕａｓｉ—ｉ·

ｄｅｎｔｉｆｉｅｒ

ａｔｔｒｉｂｕｔｅ

ｖａｌｕｅｓ

ｏｆ

ｔｈｅ

ｋ—ａｎｏｎｙｍｉｔｙ

ｐｒｉｖａｃｙ

ｐｒｏｔｅｃｔｉｏｎ

ｍｏｄｅｌ；ｔｈｅ

Ｋ。。ｐｋ

ｍｏｄｅｌ

ｔａｋｅｓ

ｔｈｅ

ｑｕａｓｉ—ｉ—

ｄｅｎｔｉｆｉｅｒ

ａｔｔｒｉｂｕｔｅ

ｖａｌｕｅｓ

ａｓ

ｒｅｌａｔｉｏｎｓ

ａｎｄ

ｕｓｅ

ｔｈｅ

ｔｕｐｌｅ－ｏｒｓ

ｗａｙｓ

ｔｏ

ｄｅｓｃｒｉｂｅ

ｔｈｅ

ｒｅｌａｔｉｏｎｓ；ｔｈｅ

Ｋｕｐｐｅｎ。，Ｍ

ｍｏｄｅｌ

ｓｅｐａｒａｔｅｓ

ｓｏｍｅ

ｇｅｎｅｒａｌｉｚａｔｉｏｎ

ｖａｌｕｅｓ

ｔｏｔｗｏ

ｆｉｅｌｄｓ：ｔｈｅ

ｕｐｐｅｒ

ｌｉｍｉｔ

ａｎｄ

ｔｈｅ

ｌｏｗｅｒ

ｌｉｍｉｔ；ｔｈｅ

Ｋｔ。

ｍｏｄｅｌ

ｂａｓｅｄ

ｏｎ

ｔｈｅ

ｐｒｏｐｅｒｔｙ

ｔｈａｔ

ｋ—ａｎｏｎｙｍｏｕｓ

ｔａｂｌｅ

ｉｓ

ｔｈｅ

ｇｅｎｅｒａｌｉｚａｔｉｏｎ

ｏｆ

ｔｈｅ

ｏｒｄｉｎａｒｙ

ｒｅｌａｔｉｏｎ

ｗｉｔｈ

ｇｅｎｅｒａｌｉｚａｔｉｏｎ

ｔｒｅｅ

ｓｐｌｉｔｓ

ｔｈｅ

ｑｕａｓｉ—ｉｄｅｎｔｉｆｉｅｒ

ａｔｔｒｉｂｕｔｅ

ｖａｌｕｅ

ｉｎｔｏ

ａ

ｃｅｒｔａｉｎ

ｔｒｅｅ

ｒｅｖｅｒｓｅｌｙ．Ａ

ｍｏｄｅｌ

ｓｐａｃｅ

ｗｈｉｃｈ

ｃｏｎｓｉｓｔｓ

ｏｆ

ｔｈｅｓｅ

ｍｏｄｅｌｓ

ｉｓ

ｇｉｖｅｎ．Ｔｈｅ

ｃｏｍｐｌｅｔｅｎｅｓｓ

ａｎｄ

ｃｌｏｓｕｒｅ

ａｂｏｕｔ

ｔｈｅｓｅ

ｍｏｄｅｌｓ

ａｒｅ

ｄｉｓｃｕｓｓｅｄ

ｌａｔｅｒ．

·收稿日期：２０１Ｉ—０５—２０；修订日期：２０ｌＩ一０７—２６

基金项目：国家自然科学基金资助项目（６１０７００３２）

通讯地址：２０１６２０上海市松江区松江大学城文汇路３００弄４公寓４０１０室

Ａｄｄｒｅｓｓ：Ｒｏｏｍ

４０１０，Ａｐａｒｔｍｅｎｔ

４，Ｌａｎｅ

３００·ＷｅｎｈｕｉＲｄ。ＳｏｎｇｊｉａｎｇＵｎｉｖｅｒｓｉｔｙＴｏｗｎ，ＳｏｎｇｊｉａｎｇＤｉｓｔｒｉｃｔ，Ｓｈａｎｇｈａｉ

２０１６２０．Ｐ．Ｒ．Ｃｈｉ—

ｎａ

万方数据

下载后可阅读完整内容，剩余6页未读，立即下载

weixin_38682254

粉丝: 7
资源: 938

K-匿名模型中不确定性数据的新型建模方法

数学建模数据集大学生助学金精准资助数据

多模态数据异步处理.pptx

k匿名算法 python adult数据集

我有一分钟高频数据，需要将其波动率分解为已实现波动率、跳跃性波动和连续性波动。然再用har-garch-rv模型对连续性波动和跳跃性波动建模。

湍流代数y+模型是k-我米噶sst模型吗

数学建模数据分析模型

MS-garch-MEDAS模型特色

用k- means算法进行建模

DCC-MIDAS-X模型构建方法

数据建模，ODS模型分析

最新资源