优化XML哈希路径索引:区间编码与B-树的协同解决方案

需积分: 4 0 下载量 155 浏览量 更新于2024-09-06 收藏 331KB PDF 举报
该篇论文主要探讨了一种改进的XML哈希路径索引技术,由周敏、郭旺和林琳三位作者共同完成,发表在《中国矿业大学(北京)计算机系》。XML作为一种重要的Web数据交换和信息集成工具,其广泛应用促使对XML文档的高效存储、管理和查询能力提出了更高要求,尤其是对于路径表达式查询的处理。 哈希路径索引树原本是一种用于XML数据的索引技术,但存在局限性,无法有效处理从非根节点开始的查询和非完全路径查询。为解决这些问题,作者们提出了一种创新的解决方案,即引入区间编码和B-树索引。通过区间编码,对哈希路径索引树进行编码,使得查询能够从任意节点出发。同时,对树中的标签节点构建B-树索引,形成了BHR(B-Tree Hashed Path Index)双层索引结构。BHR索引继承了哈希路径索引树的优点,具备良好的扩展性,且索引维护相对简单。 BHR索引技术的优势在于提高了查询效率,尤其是对于复杂的路径表达式查询,其性能提升明显。然而,先前的技术如DataGuide虽然能减少从根部遍历的节点,但对非根节点查询无效;1-index索引与XML数据量成线性关系,扩展集不相交且结构概括过大,影响了查询效率;而Fabric索引虽然支持小的I/O资源访问,但仅适用于根节点查询。因此,BHR索引的出现填补了这些技术空白,为XML文档的高效查询提供了一个更全面和实用的解决方案。 这篇论文对XML哈希路径索引技术进行了深入研究和优化,旨在应对XML文档管理中的实际挑战,为XML查询性能的提升做出了重要贡献。通过BHR索引,作者们期望能在保持原有优势的同时,增强查询灵活性和适应性,推动XML数据处理领域的进一步发展。