LCSS-TA算法:基于k-匿名改进模型的轨迹匿名方法

0 下载量 143 浏览量 更新于2024-08-26 收藏 305KB PDF 举报
"这篇研究论文探讨了一种名为LCSS-TA(最长公共子序列轨迹匿名)的算法,该算法是在k-匿名改进模型下设计的,用于处理轨迹数据的隐私保护问题,特别是针对噪声点的存在导致的轨迹相似性降低和信息损失。论文由郑剑和刘聪撰写,他们分别来自江西理工大学信息工程学院,研究方向涉及大数据隐私保护和基于匿名化的轨迹隐私保护。" 正文: 在大数据时代,轨迹数据的收集和分析变得越来越普遍,例如GPS轨迹、移动设备位置记录等。然而,这些数据中蕴含了大量的个人隐私信息,如出行习惯、常去地点等,如果不加以保护,可能会被滥用,因此轨迹数据的隐私保护成为了一个重要的话题。k-匿名模型是一种常见的隐私保护技术,它确保每个个体在匿名化后的数据集中至少与k-1个其他个体无法区分,从而增加了攻击者识别特定个体的难度。 然而,传统k-匿名模型在处理轨迹数据时面临挑战,尤其是在存在噪声点的情况下。噪声点可能是由于定位误差或其他因素导致的,它们会极大地影响欧几里得距离度量函数计算的轨迹相似性,使得实际相似的轨迹被错误地认为是不相似,从而增加了信息损失。 为了克服这一问题,郑剑和刘聪提出了一种新的LCSS-TA算法。LCSS(最长公共子序列)距离函数是一种对轨迹相似性进行度量的方法,它关注的是两条轨迹中的连续部分而非所有位置点的一对一对应。在LCSS-TA算法中,结合(k, δ)-匿名模型,他们将轨迹位置点之间的距离映射为0或1,以减少噪声点对距离计算的影响。通过这种方式,即使存在噪声点,算法也能更准确地评估轨迹的相似性,并且在保护隐私的同时,减少信息损失。 在实验部分,该算法在合成数据集和含有噪声的实际数据集上进行了测试,结果显示LCSS-TA算法在满足k-匿名隐私保护需求的同时,有效地降低了噪声干扰,提高了轨迹相似性的计算准确性,从而减少了信息损失。这表明,LCSS-TA算法对于处理轨迹数据的隐私保护问题具有显著的优势,尤其适用于那些可能受到噪声影响的场景。 总结起来,"k-匿名改进模型下的LCSS-TA轨迹匿名算法"是对传统k-匿名模型的一种创新扩展,它利用LCSS距离度量和(k, δ)-匿名模型,解决了噪声点对轨迹相似性计算的负面影响,为轨迹数据的隐私保护提供了一种更高效、更精确的解决方案。这项工作对于进一步研究和开发轨迹数据的隐私保护技术具有重要的理论和实践意义。