凝聚层次聚类提升空间co-location模式挖掘效率

需积分: 30 0 下载量 10 浏览量 更新于2024-08-11 收藏 431KB PDF 举报
本文主要探讨了基于凝聚层次聚类的co-location模式挖掘方法,针对空间数据挖掘这一重要研究领域进行了深入分析。空间co-location模式是指一组空间对象的子集,它们的实例在地理空间中表现出高度的关联性,这对于理解空间现象和发现潜在规律具有重要意义。作者首先回顾了空间数据挖掘的基本概念,指出空间co-location模式挖掘的目标是发现空间对象间的空间关联。 早期的研究者如S.Shekhar和Y.Huang提出了基于最小参与率的join-based算法,以及基于部分连接的方法,这些算法试图降低在大数据集中的连接操作带来的时间成本。然而,面对大规模数据,无连接算法被提出以缓解效率问题。M.Celik等人关注的是区域内的co-location模式挖掘,而Y.Huang等人则强调了聚类技术在空间co-location模式挖掘中的作用,他们指出聚类可以作为有效的预处理步骤,帮助简化数据并揭示隐藏的模式。 本文的核心创新在于提出了一种新的算法,该算法首先对空间数据进行凝聚层次聚类,这是一种递归划分数据集的方式,通过不断合并相似的对象直到形成大的簇。在聚类结果的基础上,作者挖掘出co-location模式,即频繁出现的簇内对象组合。这种方法结合了聚类的效率优势和co-location模式的关联性,旨在提高模式挖掘的性能。 为了验证新算法的有效性和效率,作者进行了实验评估,可能包括比较新算法与现有方法在挖掘速度、模式质量以及对大规模数据的处理能力等方面的性能。这样的评估有助于确定算法在实际应用中的适用性和改进空间数据挖掘的潜力。 这篇文章不仅介绍了空间co-location模式挖掘的基本原理,还着重讨论了一种新颖的基于凝聚层次聚类的挖掘策略,这为提升空间数据分析的精度和效率提供了新的思路和技术支持。对于空间数据挖掘、地理信息系统(GIS)、数据挖掘和机器学习等相关领域的研究者和实践者来说,这篇论文具有较高的参考价值。