DTW-TA轨迹匿名算法:基于DTW距离度量的新模型

0 下载量 20 浏览量 更新于2024-08-26 收藏 986KB PDF 举报
"基于DTW距离度量函数的DTW-TA轨迹匿名算法是一篇研究论文,探讨了如何使用DTW(动态时间规整)距离度量来改进轨迹匿名化方法,以减少信息损失并提高数据可用性。该研究由国家自然科学基金等多个项目资助,并在江西理工大学进行。作者郑剑和刘聪专注于大数据隐私保护和轨迹隐私保护的研究。" 在传统的轨迹数据匿名化方法中,通常采用欧几里得距离来衡量轨迹之间的相似性,但这种方法存在限制,即要求轨迹长度相同且时间点一一对应。这种严格的要求导致在处理不等长或存在局部时间偏移的轨迹时,信息损失较大,影响了轨迹数据的实用性。为解决这一问题,本文引入了DTW距离度量函数,这是一种能够有效处理不等长轨迹以及局部时间偏移的相似性计算方法。 DTW距离度量函数允许轨迹在时间轴上进行弹性对齐,使得不同长度的轨迹可以通过最佳匹配得到比较,从而更准确地计算相似性。基于此,论文提出了一个新的轨迹匿名模型——(k,δ,p)-匿名模型,它扩展了传统的k-匿名概念,加入了δ和p两个参数,δ用于控制时间偏移的容忍范围,而p则表示在匿名组内至少需要找到p个与目标轨迹相似的轨迹,以增强匿名性。 DTW-TA匿名算法基于这个新模型构建,旨在在保证用户隐私的同时,减少因匿名化过程导致的信息损失。通过实验验证,该算法在合成数据集和真实数据集上表现出了优秀的效果,能够在满足k-匿名要求的同时,提高轨迹数据的可用性和准确性。 关键词涉及的核心概念包括轨迹数据、隐私保护、DTW距离度量、(k,δ,p)-匿名模型以及数据可用性。这些关键词揭示了研究的主要焦点,即利用先进的距离度量技术提升轨迹数据的隐私保护水平,同时确保数据的有效利用。 这篇论文贡献了一种创新的轨迹匿名策略,它克服了传统方法在处理非对齐轨迹时的局限性,为大数据环境中的轨迹隐私保护提供了新的解决方案。通过DTW-TA算法,研究人员和数据分析师可以更好地平衡隐私保护和数据利用之间的矛盾,这对于移动轨迹数据的管理和分析具有重要的实际意义。