GPU加速的H-BLAST:生物信息学中蛋白质序列比对的高效工具

需积分: 10 0 下载量 187 浏览量 更新于2024-08-26 收藏 578KB PDF 举报
H-BLAST是一种专为在具有GPU的异构计算机上加速蛋白质序列比对而设计的高效工具包。随着生物信息学领域中生物序列数据库的爆炸性增长,传统的比对软件面临着性能提升的需求。为了满足这一挑战,研究人员Weicai Ye、Ying Chen、Yongdong Zhang和Yuesheng Xu,分别来自中山大学数据与计算机科学学院和广东省计算科学重点实验室,以及美国雪城大学数学系名誉教授,共同开发了H-BLAST。 H-BLAST的核心动机是针对生物序列分析中的基础问题——蛋白质序列比对,BLAST作为这个领域中被广泛引用的工具,在过去的二十年里积累了超过118000次引用。随着基因组数据的海量增长,对于处理这些数据的软件来说,提升计算速度至关重要。H-BLAST的设计巧妙地将CPU(中央处理器)和GPU(图形处理器)的计算能力结合起来,实现了并行搜索,特别针对BLASTX和BLASTP这两种NCBI(国家生物技术信息中心)基本的序列比对工具进行优化。 该工具的优势在于其利用了GPU的强大并行处理能力,能够在处理大规模数据时显著提高执行效率。通过在异构平台上运行,H-BLAST能够更有效地分配任务,同时充分利用两种处理器的不同优势:CPU负责管理和协调任务,而GPU则以其并行计算核心来执行重复性高的比对运算。这种协同工作模式使得H-BLAST在处理复杂的序列匹配任务时,无论是速度还是性能上都超越了单靠CPU的传统BLAST工具。 H-BLAST的开发过程中,研究人员于2016年8月6日首次提交了论文,并经过了多次修订和审稿,最终于同年12月12日接受发表。这标志着生物信息学领域中一个重要的进步,为基因组学研究者提供了一种更为高效、适应未来数据密集型需求的蛋白质序列比对工具。通过H-BLAST,科学家们能够更快地分析和理解生物序列,推动生物学和医学研究的进展。