并行XML数据库分片策略优化:WIN算法

需积分: 0 1 下载量 81 浏览量 更新于2024-09-14 收藏 558KB PDF 举报
"一种并行XML数据库分片策略" 本文主要探讨了XML文档的并行数据分片策略,这是为了实现XML查询的高效并行处理。XML数据分片的关键在于如何有效地分割数据,使得在分布式系统中能均衡地分配查询负载。文章中引入了一个名为“媒介节点”的概念,媒介节点集合可以将XML数据树分解为一个根树和多个子树的集合。根树在所有计算节点上复制,而子树则根据用户查询的工作负载被均匀地分发到各个站点。 作者指出,对于同棵XML数据树,可能存在多种媒介节点的组合,从而产生不同的数据分片结果。然而,关键在于找到一组最佳的媒介节点集合,以确保数据分片后的查询工作负载均衡。这个问题被证明是NP-hard,即在计算复杂性理论上属于困难问题。为了解决这个问题,作者提出了一套启发式优化规则,并基于这些规则设计了一种名为WIN(workload-aware intermediary nodes data placement strategy)的算法。 WIN算法的核心是根据工作负载来智能选择媒介节点,以实现数据的最优分片。通过实验,该算法的表现优于已有的并行XML数据分片策略,证明了其在性能上的优越性。实验结果表明,WIN算法能够有效提高查询效率,降低响应时间,同时保持系统资源的均衡利用。 此外,文章发表在《软件学报》第17卷第4期,2006年4月出版,ISSN号为1000-9825,CODEN号为RUXUEW。文章的数字对象标识符(DOI)为10.13600/os170770,由《软件学报》版权所有。作者包括王国仁、汤南、于亚新、孙冰和于戈,他们均来自东北大学信息科学与工程学院。 这篇研究论文提出了一种创新的并行XML数据库分片策略,通过引入媒介节点和优化算法,解决了在分布式环境下XML查询处理的效率和负载均衡问题,为XML数据库的并行处理提供了新的解决方案。