改进Hausdorff距离的轨迹子段聚类算法:提升效果与应用

需积分: 50 4 下载量 63 浏览量 更新于2024-08-11 2 收藏 579KB PDF 举报
本文主要探讨了一种针对长轨迹聚类问题的改进算法——基于改进Hausdorff距离的轨迹聚类算法(CTIHD),它在2012年发布。传统的以整条轨迹作为聚类目标的方法在处理长轨迹时存在效率低下的挑战,因为这可能导致复杂度增加且难以提取出关键特征。CTIHD算法的提出旨在解决这一问题,通过将轨迹分解为更小、更具代表性的轨迹子段,提高了聚类的效率和精度。 核心贡献在于提出了一种新的轨迹子段距离度量方法,这种方法旨在消除子段之间可能存在的公共偏差,即子段内的重复路径部分。通过识别并利用轨迹中的特征点,算法能够更有效地分割轨迹,将其划分为一系列独立的轨迹子段集。这些子段之间的相似度计算采用Hausdorff距离,这是一种经典的形状匹配度量,可以捕捉到两个形状之间的最大局部差异。 Hausdorff距离的改进版本在本研究中发挥了关键作用,因为它能够更好地反映轨迹子段之间的异同,而不受个别异常点的影响。这样,算法能够更准确地评估轨迹之间的相似性,从而实现更为有效的聚类。此外,论文还提到了多种资助项目,如国家自然科学基金、浙江省自然科学基金、信息处理与自动化技术浙江省重中之重学科开放基金等,这反映了研究团队在学术领域的广泛支持和对该课题的重视。 作者团队由陈锦阳(硕士,主研移动数据库技术和数据挖掘)、宋加涛(教授,通信作者)、刘良旭(副教授)和王让定(教授)组成,他们在2011年10月11日提交了初稿,并在同年12月19日进行了修订。他们的研究工作不仅关注理论创新,也注重实际应用,特别是针对移动数据和轨迹分析的场景。 实验结果显示,相比于同类聚类算法,CTIHD算法在轨迹聚类效果上表现更优,显示出更高的聚类精度和效率。关键词包括“轨迹聚类”、“运动模式”、“Hausdorff距离”、“点特征矩阵”以及“轨迹子段”,这些都是文章的核心技术点和研究焦点。 这篇文章提供了一种新颖的轨迹聚类策略,通过改进的距离度量和轨迹子段处理方法,解决了长轨迹聚类中的问题,为移动数据分析和轨迹挖掘领域提供了有价值的技术支持。