群组密度驱动的高效轨迹聚类算法

需积分: 19 2 下载量 115 浏览量 更新于2024-08-06 收藏 1.43MB PDF 举报
本文主要探讨了在大规模轨迹数据处理中的一个关键问题,即现有的基于密度的聚类方法在处理轨迹数据时的局限性。传统方法往往难以适应轨迹数据的特性,因为轨迹数据通常包含连续的空间和时间信息,而非独立的点数据。为了解决这个问题,作者提出了一种新颖的轨迹聚类算法,该算法融合了群组和密度的概念。 首先,算法采用了最小描述长度原则对轨迹进行预处理,将轨迹划分为具有相似特征的子轨迹段,这有助于减少后续聚类过程中的复杂度。通过两次遍历轨迹数据集,算法构建了一个基于子轨迹段的群组集合,每个群组代表了一类具有相似行为模式的轨迹片段。这种群组划分减少了在邻域对象集搜索中的距离计算,提高了效率。 群组可达性和邻域搜索是算法的核心组成部分。通过群组搜索,算法能够在群组内部查找邻居,而不是在整个数据集中逐个比较距离,从而大大降低了计算负担。这种方法在小数据集和大数据集上都显示出了显著的优势,分别实现了73.79%和84.19%的时间减少。随着轨迹数据集规模的增大,这种效率提升更为明显,表明算法对于大规模数据处理具有很好的扩展性。 在实际应用中,作者选择了大西洋飓风轨迹数据集进行实验验证。结果显示,相比于基于密度的TRACLUS轨迹聚类算法,新提出的算法不仅运行时间更短,而且聚类结果更为精确。这表明,通过结合群组和密度的策略,该算法能够有效地处理大规模轨迹数据,提升聚类性能。 总结来说,这篇论文介绍了一种创新的轨迹聚类算法,它通过群体结构和密度分析,优化了轨迹数据的聚类过程,显著提高了效率和准确性。这对于处理大规模轨迹数据,如地理位置追踪、移动设备数据或天气系统监测等领域,具有重要的理论和实践价值。在未来的研究中,这种方法可能被进一步优化和扩展,以适应更广泛的应用场景。