并发广度优先搜索(iBFS)在GPU上的实现与优化

0 下载量 72 浏览量 更新于2024-08-25 收藏 1.17MB PDF 举报
"iBFS - Concurrent Breadth-First Search on GPUs - 2016 (ibfs_tcm18-284417)-计算机科学" 本文介绍了一种名为iBFS(并发广度优先搜索)的算法,该算法针对图形处理单元(GPU)进行了优化,用于高效执行多源节点的并发BFS。传统的BFS是一种关键的图算法,具有广泛的应用,例如在社交网络分析、路由算法和最短路径查找等领域。然而,同时进行多个BFS遍历以提高效率和探索更多可能性的需求催生了并发BFS的研究。 作者Hang Liu、H. Howie Huang和Yang Hu来自乔治华盛顿大学的电气与计算机工程系。他们设计并实现了iBFS,这是一种新的方法,能够有效地在GPU上运行并发BFS任务。以下是iBFS的核心特点: 1. **单一GPU内核**:iBFS创新地使用了一个单一的GPU内核来实现并发BFS,使得不同实例间的共享前沿能够被充分利用。这意味着不同BFS遍历可以并行进行,并且能够有效地协调共享数据,从而提高整体性能。 2. **基于出度的GroupBy规则**:iBFS通过基于出度的分组策略选择性地运行BFS实例。这一规则有助于最大化同一组内实例之间的前沿共享,减少了数据冗余和通信开销,进一步提升了性能。 3. **优化的位操作**:iBFS利用GPU上的高度优化的位操作技术,使单个GPU线程能够快速检查和处理大量信息。这提高了处理速度,使得在大规模图数据上执行并发BFS变得更为高效。 iBFS的这些设计不仅减少了GPU资源的浪费,还显著增强了并发性能。在大数据和复杂图形分析的背景下,这种优化对于提高计算效率至关重要。通过并发处理,iBFS能够更有效地应对大规模图结构中的并行任务,同时保持低延迟和高吞吐量。 iBFS是GPU计算领域的一个重要突破,它展示了如何通过创新算法设计和硬件特性利用,将图形算法的性能推向新的高度。对于需要处理大量图数据的领域,如社交网络分析、网络路由、生物信息学和机器学习等,iBFS提供了强大且高效的解决方案。