移动轨迹与社交网数据的高效去匿名化技术及实战验证

0 下载量 93 浏览量 更新于2024-06-16 收藏 1.46MB PDF 举报
"移动轨迹和社交网数据的强大去匿名化方法及实验结果" 本文探讨了在当前数字化时代,随着移动应用和社交网络的普及,个人数据隐私所面临的严重威胁。研究者提出了一种创新的、高效的方法来执行去匿名化攻击,针对移动轨迹和社交网络数据。去匿名化是恢复看似匿名数据中的个人信息的过程,这在数据隐私保护领域是一个关键挑战。 文章首先介绍了一种名为“统一相似性”(US)的度量标准,该标准综合考虑了数据的局部和全局结构特征、从辅助数据中获取的信息,以及在去匿名化进程中的反馈知识。通过在实际数据集上应用US,研究人员发现不同数据可以被不同程度地去匿名化,有些可以精确还原,而有些则需要在较粗粒度级别上处理。 接下来,研究者提出了一个基于US的去匿名化(DA)框架,该框架迭代地进行数据去匿名化,同时确保一定的准确性。DA框架能够逐步提高数据匹配的精度,确保了去匿名化过程的可靠性。 然而,对于大规模数据集,直接应用DA可能会遇到挑战,特别是当不知道匿名数据和辅助数据之间的重叠程度时。因此,研究者进一步发展出自适应去匿名化(ADA)框架。ADA通过巧妙处理两个核心匹配子图,能够在保持高去匿名化准确性的同时,降低计算复杂性。这一改进使得处理大规模数据成为可能,即使在缺乏重叠信息的情况下也能有效执行。 实验部分,研究者对三个移动轨迹数据集(圣安德鲁斯、Infocom06和Smallblue)和三个社交网络数据集(ArnetMiner、Google+和Facebook)进行了去匿名化攻击。结果显示,提出的去匿名化框架不仅效果显著,而且对噪声具有很好的鲁棒性。 这项研究强调了数据匿名化的复杂性和挑战,并提供了解决方案。作者还提供了源代码和数据集,以便其他研究者能复现和扩展这些结果。此外,该研究受到了国家科技支撑计划的支持,并指出其中的观点和结论仅代表作者,不涉及任何政府机构。 关键词和主题包括:图去匿名化、社交网络分析、移动轨迹隐私、数据匿名化和清理。这项工作的贡献在于提高了对匿名数据保护的理解,同时也揭示了数据隐私保护的重要性,尤其是在移动轨迹和社交网络数据日益丰富的今天。