压缩全文索引在演变图查询中的应用

需积分: 0 0 下载量 50 浏览量 更新于2024-09-11 收藏 733KB PDF 举报
"这篇论文研究了如何利用压缩全文索引技术优化基于演变图的查询效率。作者提出了一种新的查询模型,旨在从大规模演变图中找出具有相同变化规律的子图,尤其关注那些在特定时间范围内展现出相似演变趋势的空间信息。演变图广泛应用于多种场景,如社会网络分析,其中用户及其关系构成了一个动态变化的图结构。 传统的图查询方法在面对大规模演变图时,查询代价高昂,因为需要反复遍历整个图。论文中提到,现有的基于枚举的哈希索引算法虽然可以在一定程度上加速查询,但其预处理阶段的时间和空间开销很大。为了解决这一问题,作者引入了压缩的全文索引技术,结合涡轮转换和后缀数组的概念,设计了一种新的索引方法。 后缀数组是一种高效的文本索引结构,能够快速地执行模式匹配查询。论文中提到了两种不同的线性时间复杂度算法来构建后缀数组,这些算法保证了预处理过程的稳定性和效率。涡轮转换则是一种数据压缩技术,用于减少存储需求,同时保持数据的可搜索性。 通过在实际数据集(如Facebook社交网络和Enron邮件系统)以及模拟数据集上的实验,论文评估了所提出的算法在可行性、效率和可扩展性方面的性能。实验结果证实了这种方法能够在减少预处理成本的同时,有效提高对大规模演变图的查询速度。 这篇论文贡献了一种创新的查询策略,将压缩全文索引应用于演变图查询,降低了大规模数据处理的负担,对于实时监测和分析动态图数据具有重要意义。这一工作对于图数据库管理、社会网络分析以及其它涉及动态关系数据的领域都有潜在的应用价值。"