图神经网络与注意力机制在端到端蛋白质-小分子结合预测中的应用

需积分: 0 0 下载量 67 浏览量 更新于2024-09-05 收藏 3.29MB PDF 举报
"这篇论文是关于使用图网络、注意力机制和卷积神经网络(CNN)进行端到端学习,预测蛋白质与小分子结合亲和力的研究。它在生物信息学领域具有重要意义,尤其是在药物发现的虚拟筛选过程中。作者是Masashi Tsubaki、Kentaro Tomii和Jun Sese,来自日本的国家先进工业科学技术研究所人工智能研究中心和AIST-TokyoTech Real World Big-Data Computation Open Innovation Laboratory。 论文指出,传统的机器学习方法在预测化合物-蛋白质相互作用(CPIs)方面扮演着重要角色。近年来,深度神经网络在端到端表示学习上的应用,特别是在自然语言处理中的单词等离散符号数据,已经在各种复杂问题上展现出了卓越的表现。对于CPI问题,数据通常以离散符号形式提供,如蛋白质和小分子的序列。 论文的主要贡献是提出了一种新的框架,将图神经网络(GNN)用于处理蛋白质和小分子的结构信息,因为这些实体可以被视为图的形式,其中节点代表原子,边代表化学键。GNN能够捕捉图形结构中的局部和全局模式。同时,注意力机制被引入来权重不同部分的贡献,这有助于模型聚焦于对预测亲和力至关重要的特征。结合CNN,该模型可以处理序列数据,捕获顺序模式,这对于蛋白质序列尤其重要。 实验结果表明,这种端到端的学习方法在预测CPIs时,相比传统方法,能更有效地学习特征表示并提高预测准确性。论文还可能涵盖了训练细节、性能评估标准、与其他方法的比较以及可能的应用场景。 此外,论文的出版日期、接收、修订和接受日期以及编辑信息对于理解其在研究领域的时效性和影响力也是关键。然而,具体的doi、出版日期和编辑名字在提供的信息中没有完全给出。" 这篇研究不仅展示了深度学习在生物信息学中的潜力,也揭示了跨学科技术(如图神经网络、注意力机制和CNN)如何协同工作,以解决复杂的生物问题。这样的方法可能会对未来的药物设计和个性化医疗产生深远影响。