DrugCLIP:对比学习驱动的高效虚拟筛选框架

需积分: 0 1 下载量 173 浏览量 更新于2024-06-14 收藏 6.97MB PDF 举报
"DrugClip是一种基于对比学习的深度学习方法,应用于虚拟筛选,旨在高效地从大量化合物库中找出与特定蛋白质结合的潜在药物分子。它通过预训练编码器计算蛋白质和分子的表示,并利用对比损失最大化蛋白质-分子对之间的相似性。与传统的对接方法和监督学习方法相比,DrugClip降低了对标注数据的依赖,适用于大规模未标注数据,并通过引入HomoAug数据增强策略提升表示学习。此外,DrugClip采用的密集检索设置允许预先计算编码,提高了在线推理的效率,使得高通量虚拟筛选成为可能。" DrugCLIP是针对虚拟筛选问题的一个创新解决方案,它将虚拟筛选任务转换为密集检索任务,采用对比学习策略来学习和优化蛋白质和分子的表示。这种方法解决了传统对接方法在处理大规模化合物库时的计算效率低下问题,以及监督学习方法对于大量有标签数据的依赖。对比学习的核心在于,通过无标签的蛋白质-分子对数据,最大化那些实际能够结合的对之间的相似性,同时最小化非结合对之间的相似性。 在DrugCLIP中,提出的HomoAug数据增强策略是基于蛋白质的同源进化,生成蛋白质-分子对,以此丰富学习过程中的样本多样性,帮助模型学习更强大的表示能力。这一策略增强了模型在处理未见过的蛋白质-分子配对时的泛化能力。 此外,DrugCLIP的另一个优势在于其高效的检索机制。通过预先计算蛋白质和分子的编码,可以极大地加快在线推理的速度,这对于处理海量的分子数据至关重要。尤其是在零样本设置下,即没有特定蛋白质的绑定亲和力数据时,DrugCLIP的性能显著优于其他方法,极大地缩短了计算时间。 在实验中,DrugCLIP在多种虚拟筛选基准上展现出优越的性能,验证了其在减少计算时间和提高筛选准确性的双重优势。这使得DrugCLIP成为人工智能辅助药物发现领域的一个有力工具,对于加速新药研发过程,特别是面对复杂疾病靶点的药物筛选,具有重大意义。