多GPU正则表达式匹配加速技术

0 下载量 57 浏览量 更新于2024-08-26 收藏 317KB PDF 举报
"这篇研究论文探讨了基于多GPU的正则表达式匹配技术,旨在解决传统正则匹配效率低下的问题。通过设计一个多GPU的正则表达式匹配引擎,并利用折半分组优化算法,有效地处理了大规模正则集合导致的空间爆炸问题,从而提高了数据匹配的速度。实验结果显示,该多GPU匹配技术相比CPU有61倍的性能提升,并且其数据吞吐率显著优于其他加速方法。该研究涉及的关键技术包括匹配技术、正则表达式、模式匹配、并行技术和优化算法。" 正则表达式匹配是计算机科学中的一个重要概念,用于在文本中查找符合特定模式的字符串。然而,随着数据量的增加,传统的单线程正则匹配算法的性能瓶颈日益明显,特别是在大规模正则集合的情况下,有限状态自动机(FSA)的空间需求会急剧增长,导致无法有效处理。 本论文提出的基于多GPU的正则表达式匹配技术,是为了解决这一挑战。GPU(图形处理器)因其并行计算能力强大,被广泛用于高性能计算领域。通过将正则匹配任务分布到多个GPU上,可以实现并行处理,显著提高匹配速度。论文中的折半分组优化算法是针对FSA在大规模正则集合下空间占用过大的问题而设计的,它通过智能地划分和分配正则表达式,减少了内存需求,同时保持了匹配的准确性。 在实验部分,研究人员对比了基于多GPU的正则表达式匹配技术与CPU执行的性能,结果表明GPU方案在匹配速度上有显著优势,性能提升了61倍。这意味着在处理大量数据时,这种技术能显著缩短处理时间,提高效率。此外,其数据吞吐率的提升意味着系统在单位时间内能处理更多的数据,这对于大数据分析和实时监控等应用具有重要意义。 这项工作的创新点在于结合了并行计算和正则表达式的特性,提出了新的优化策略,对于大数据环境下的文本处理和搜索有着重要的实践价值。同时,它也为未来的研究提供了新的方向,如何进一步优化GPU在正则匹配中的应用,以及如何在更多复杂场景下应用这种技术,都是值得继续探索的问题。