没有合适的资源?快使用搜索试试~ 我知道了~
首页改进的V-MDAV算法:灰关联分析下的隐私保护与信息损失
改进的V-MDAV算法:灰关联分析下的隐私保护与信息损失
需积分: 24 0 下载量 81 浏览量
更新于2024-08-13
收藏 1.37MB PDF 举报
本文主要探讨的是"基于灰关联分析的V-MDAV算法研究"。在这个领域,距离度量在微聚集算法中扮演着关键角色,它直接影响着聚类结果的质量。原始的V-MDAV算法可能依赖于欧氏距离度量,但这种度量容易受到局部奇异值的影响,可能导致信息损失和隐私泄露的风险。针对这个问题,研究者提出了V-GRAV算法,即基于灰关联分析的V-MDAV算法。 灰关联分析引入了均衡接近度的概念,这是一种新的距离度量方法。均衡接近度不仅考虑了整体的接近性,还关注序列的均衡性,这使得V-GRAV算法在保持与V-MDAV算法相近的信息处理能力的同时,显著降低了隐私泄露的可能性。通过替换欧氏距离,V-GRAV算法能够更好地平衡聚类效果和隐私保护,提高了算法的鲁棒性和稳定性。 研究背景是国家自然科学基金青年项目和福建省自然科学基金的资助,由张岐山教授和郑丽君硕士共同合作完成。他们的研究方向分别为数据挖掘、系统优化与仿真以及隐私保护。论文强调了在实际应用中,特别是在处理敏感数据时,V-GRAV算法的有效性得到了验证,其在保护用户隐私的同时,维持了数据分析的准确性。 该研究的关键词包括隐私保护、V-GRAV算法、均衡接近度、信息损失和隐私泄露风险,这些关键词反映了文章的核心内容和贡献。论文引用了中图分类号和文献标志码,并给出了文章的DOI和文章编号,表明这是经过同行评审并发表的研究成果。 本文是对现有V-MDAV算法的一种改进,旨在提升隐私保护能力,适用于那些对数据隐私有高要求的应用场景,如医疗、金融等领域。通过引入灰关联分析和均衡接近度,V-GRAV算法在聚类性能和隐私保障方面取得了显著的进步。
资源详情
资源推荐
收稿日期:20180623;修回日期:20180814 基金项目:国家自然科学基金青年项目(61300104);福建省自然科学基金资助项目
(2018J01791)
作者简介:张岐山(1962),男,黑龙江绥化人,教授,博导,博士,主要研究方向为数据挖掘、系统优化与仿真(zhangqs@fzu.edu.cn);郑丽君
(1993),女,硕士,主要研究方向为隐私保护.
基于灰关联分析的 VMDAV算法研究
张岐山,郑丽君
(福州大学 经济与管理学院,福州 350108)
摘 要:距离度量会影响微聚集算法的聚类效果,为了提高算法的隐私保护能力,采用灰关联分析中的均衡接
近度替代 VMDAV算法中的欧氏距离度量记录间的距离,提出基于灰关联分析的 VMDAV算法,即 VGRAV算
法。由于均衡接近度既包含灰关联度对整体接近性的测度,又具有均衡度对序列均衡性测度的特点,克服了欧
氏距离受局部奇异值影响较大的问题,所以 VGRAV算法在保证信息损失与 VMDAV相近的同时,较大程度地
降低隐私泄露风险,实验证明了算法的有效性。
关键词:隐私保护;VGRAV算法;均衡接近度;信息损失;隐私泄露风险
中图分类号:TP309.2 文献标志码:A 文章编号:10013695(2020)01022010705
doi:10.19734/j.issn.10013695.2018.06.0464
ResearchonVMDAValgorithmbasedongreyrelationalanalysis
ZhangQishan,ZhengLijun
(SchoolofEconomics&Management,FuzhouUniversity,Fuzhou350108,China)
Abstract:Distancemeasurecanaffecttheclusteringeffectofmicroaggregationalgorithms,inordertoimprovetheprivacy
preservingabilityofthealgorithm
,theEuclideandistanceintheVMDAValgorithmwerereplacedbythebalancedadjacent
degreeingreyrelationalanalysismethodtomeasurethedistancebetweenrecords.ThispaperproposedtheVMDAValgorithm
basedongreycorrelation,calledVGRAValgorithm.Thebalancedadjacentdegreeincludedthecharacteristicofthemeasure
ofgreyrelationaldegreetothewholeapproximationandbalanceddegreetothesequencebalanceddegree
,whichcouldelimi
natethepointcorrelationtendency.ItovercametheproblemthattheEuclideandistancewasgreatlyinfluencedbythelocal
singularvalue.Therefore,theVGRAValgorithmcanreducetheprivacydisclosureriskwhileensuringthattheinformation
lossissimilartoVMDAValgorithm.Thisexperimentsdemonstratethatthealgorithmiseffective.
Keywords:privacyprotection;VGRAV(variablesizegreyrelationtoaveragevector)algorithm;balancedadjacentdegree;
informationloss;privacydisclosurerisk
随着数据挖掘技术的成熟,利用数据获取有用信息或知识
越来越受到学术界及业界的关注。但与此同时,个人的习惯、
品味等不愿为人所知的信息都以惊人速度被推断并被消费,因
此隐私保护问题日渐突出。
为了解决隐私保护问题,
Samarati等人
[1]
于 1998年提出
k匿名技术,该技术要求发布的数据中至少存在 k条不可区分
的记录,使攻击者无法通过发布的数据回溯个人,防止隐私信
息与个人的匹配。因此,k匿名技术在一定程度上保护了用户
的个人隐私。隐私保护在实现过程中,多数采用泛化
/隐匿技
术
[2~5]
,而属性值泛化域的确定一直是一个难以解决的问题,
而且对数值型数据的泛化易导致语义缺失,造成不必要的信息
损失。对此,很多学者将
SDC(statisticaldisclosurecontrol)技术
中的微聚集(microaggregation)算法用于数据表 k匿名化以解
决泛化技术在数值型数据应用上的不足。其中,MDAV(maxi
mumdistancetoaveragevector)算法是一种实现数值型数据匿
名化十分重要且性能较好的微聚集算法。该算法已被证明在
所得到的等价组的同质性方面表现最好。然而 MDAV作为固
定尺寸的启发式算法,在某些情况下,它会产生远离最优的 k
分组。为此,一种新的启发式多元微聚集方法 VMDAV
[6]
应运
而生,该方法形成可变尺寸大小的等价组,使分组更自然地适
应数据集分布,增加组内同质性。但是 VMDAV算法采用欧
氏距 离 度 量 记 录 间 的 距 离 时 受 奇 异 值 影 响 较 大,因 此,
VMDAV算法在一定程度上会影响隐私保护效果。为此,本文
在 MDAV算法基础上引入均衡接近度提出 GRAV算法
[7]
的思
想,提出了 VGRAV算法,该算法在 VMDAV算法基础上,将
均衡接近度代替欧氏距离进行
k聚集。均衡接近度作为灰关
联分析的改进方法,其与数理统计中的回归分析等方法不同,
它对样本数据量及样本规律性不作限制,而且计算量小,其量
化结果与定性分析的结果一致,特别适用于小样本、无明显规
律数据的研究
[8]
。该算法具有灰关联分析方法不受数据分布
规律性影响的特点,同时克服了欧氏距离和灰关联分析方法存
在的点关联倾向。因此将均衡接近度用于衡量记录间的距离
进行
k匿名,能够在保证信息损失量与 VMDAV算法相当的
同时,较大程度地降低隐私泄露风险。
1 相关工作
11 VMDAV算法
最优多变量微集聚问题不能在多项式时间内精确求解,因
此多变量微聚集是 NPhard问题
[9]
,其唯一可行的多变量微聚
集方法是启发式的。MDAV算法
[10,11]
是著名的固定尺寸的启
发式算法。该算法产生固定基数为 k的等价组,然而,MDAV
作为固定尺寸的启发式算法,在某些情况下,它会产生远离最
优的 k分组。为消除不自然 k分组的影响,Solanas等人
[6]
提
出 VMDAV算法,该算法能适应数据集分布,产生更加自然的
第 37卷第 1期
2020年 1月
计 算 机 应 用 研 究
ApplicationResearchofComputers
Vol.37No.1
Jan.2020
下载后可阅读完整内容,剩余4页未读,立即下载
weixin_38605133
- 粉丝: 3
- 资源: 916
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- C++多态实现机制详解:虚函数与早期绑定
- Java多线程与异常处理详解
- 校园导游系统:无向图实现最短路径探索
- SQL2005彻底删除指南:避免重装失败
- GTD时间管理法:提升效率与组织生活的关键
- Python进制转换全攻略:从10进制到16进制
- 商丘物流业区位优势探究:发展战略与机遇
- C语言实训:简单计算器程序设计
- Oracle SQL命令大全:用户管理、权限操作与查询
- Struts2配置详解与示例
- C#编程规范与最佳实践
- C语言面试常见问题解析
- 超声波测距技术详解:电路与程序设计
- 反激开关电源设计:UC3844与TL431优化稳压
- Cisco路由器配置全攻略
- SQLServer 2005 CTE递归教程:创建员工层级结构
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功