互联网开放平台的隐私保护关联规则挖掘算法

需积分: 0 1 下载量 169 浏览量 更新于2024-09-08 收藏 1.16MB PDF 举报
"这篇论文研究了面向互联网开放平台保护用户隐私的关联规则挖掘算法,旨在解决在开放平台授权服务中用户隐私信息可能被滥用或泄露的问题。提出的是一种分布式算法,无需可信第三方参与,通过开放平台与网站之间的协作,对用户隐私进行保护的同时进行关联规则挖掘。算法基于频繁-1项集编号和用户身份标志符生成布尔型矩阵,经过开放平台的矩阵扰动和整合,由网站在整合后的矩阵上挖掘全局关联规则。实验表明该算法有效且通信代价不会显著影响挖掘时间效率。" 文章深入探讨了互联网开放平台在提供用户信息授权服务时所面临的隐私保护挑战。传统的数据挖掘方式可能导致用户隐私信息在多处存储,增加了泄露风险。为此,研究者提出了一种创新的分布式关联规则挖掘算法。这个算法的核心是避免直接暴露用户隐私数据,而是通过开放平台和网站之间的协同操作来实现。 首先,开放平台和网站根据挖掘条件分别生成以频繁-1项集编号和用户身份标志符为标识的布尔型矩阵。这种矩阵表示方式能够隐藏具体用户信息,同时保留数据挖掘的基础。接着,开放平台执行矩阵扰动操作,这是一种对数据进行混淆的技术,旨在保护用户隐私。然后,经过扰动的矩阵被整合,网站可以在整合后的矩阵上进行全局关联规则的挖掘,这样可以获取到有价值的关联信息,而无需直接接触用户的敏感信息。 实验结果证实了该算法的有效性,它在保护用户隐私的同时,仍能保持较高的挖掘效率,通信成本的增加并未显著影响整体的挖掘速度。这意味着该算法在实际应用中具有良好的可扩展性和实用性,对于平衡互联网开放平台的数据利用与用户隐私保护提供了新的解决方案。 此外,论文还提到了两位作者的研究背景,王晗副教授和张玲硕士研究生,他们的主要研究领域包括管理信息系统、商务智能和隐私保护。论文发表在《燕山大学经济管理学院》期刊,并被河北省自然科学基金青年科学基金资助,这表明该研究具有一定的学术价值和实际意义。 关键词: 开放平台、隐私保护、分布式、关联规则挖掘 这篇研究不仅为互联网开放平台的隐私保护提供了理论支持,也为实际系统设计提供了参考,有助于在保障用户隐私的同时,推动数据挖掘技术在开放平台环境中的健康发展。