没有合适的资源?快使用搜索试试~ 我知道了~
生命科学中的人工智能2(2022)100037观点蛋白质-配体相互作用的深度学习于尔根·巴约拉特生命科学信息学和数据科学系,B-IT,LIMES程序单元化学生物学和药物化学,Rheinische Friedrich-Wilhelms-Universität,Friedrich-Hirzebruch-Allee 5/6,Bonn D-53115,Germany深度学习在药物设计中的一个深入研究的应用是基于蛋白质-配体复合物的三维结构预测化合物的效力(亲和力)。一致准确的配体结合能力预测将代表该领域的里程碑事件,并将基于结构的配体设计推向一个新的水平。为此,应用了具有配体结合位点的体表示的卷积神经网络(CNN)[1]以及包括消息传递神经网络(MPNN)[3]的图神经网络(GNN)[2]GNN/MPNN直接从分子图中学习。一般来说,MPNN在化学表征学习中越来越受欢迎。对于使用GNN/MPNN的重复性预测,采用这些神经网络架构,各种各样的神经网络-近年来,已经报道了基于蛋白质-配体复合物结构的疾病预测模型基于图形的模型通常在预测的和实验观察到的配体结合能力之间实现高相关性(在80%水平),并且预测准确度在一个数量级内或接近一个数量级(10倍)。这些观察结果引发了反复出现的假设或声称,即深度神经网络能够学习特定的蛋白质-配体相互作用。然而,这也意味着所产生的模型将以这样或那样的方式捕获这些相互作用的物理化学基础。通过学习分子相互作用图,这可能是可以想象的吗?不管这样的主要考虑,一些观察表明,各种蛋白质-配体亲和力预测模型报告的有希望的结果蛋白质-配体复合物结构的重要资源可用的实验数据是PDBbind数据库[5]这是许多研究的基础。然而,具有高质量分辨率测量的高分辨率结构的数量是有限的,并且PDBbind的组成偏向于优选的晶体学目标[6,7],这自然限制了从这些数据中导出的预测模型的通用化能力。这与不同的训练和测试数据划分可以显著影响模型性能的发现一致[6]。另一方面,不同大小的训练集通常会产生类似准确的蛋白质-还观察到,CNN模型仅在蛋白质上训练 或配体表示可以接近或满足在蛋白质-配体相互作用数据上综上所述各项研究结果表明,CNN和GNN免疫预测模型可能主要是从复杂结构中记忆训练数据信息对于泛化能力有限的深度复合分类模型,也观察到了类似的记忆效应[10]。最近对蛋白质-配体相互作用模型的科学严格研究对于给定的复杂结构,Rognan及其同事使用不同定义的节点和边生成了配体(L)、蛋白质(P)和蛋白质-配体相互作用(I)的图形表示例如,蛋白质结合位点残基表示为用相互作用相关化学属性信息注释的节点。此外,在相互作用图中,将分别表示由配体原子和结合位点残基形成的相互作用位点的不同节点组合,并且边缘说明非共价短程相互作用(用它们的距离注释)。从三个图形表示中,七个训练星座包括单独的图(L,P,I),三个成对组合(PL,PI,LI),以及组合所有三个图的三元组(PLI)。该框架被用来推导不同的MPNN模型,然后将其应用于从不同的测试集预测复杂结构的配体活性。通过计算预测值和实验值的Pearson相关系数(RP)以及均方根误差(RMSE)来量化预测性能通常发现模型具有预测性,RP值高于0.6,最大为0.8。重要的是,仅基于L或P图比在相互作用图上训练的模型(I模型)更准确,其中基于配体的模型表现最好。PL模型进一步提高了精度,这与在所有三个图上训练的PLI模型非常相似。这些发现最终证明,使用MPNN的预测不依赖于学习特定的作者进一步扩展了他们的分析。例如,发现MPNN模型显示有限的泛化潜力,但对训练集大小的减少不敏感。此外,生成简单的“记忆基线”模型,基于来自训练集的最相似配体或蛋白质的平均值预测复合物的多样性。有趣的是,配体基线模型几乎达到了I模型的精度综上所述,这些结果表明,电子邮件地址:bajorath@bit.uni-bonn.dehttps://doi.org/10.1016/j.ailsci.2022.100037接收于2022年5月25日;接受于2022年5月25日2022年5月26日网上发售2667-3185/© 2022作者。由Elsevier B. V.发布。这是一个CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)可在ScienceDirect上获得目录列表生命科学期刊首页:www.elsevier.com/locate/ailsciJ. 巴约拉特生命科学中的人工智能2(2022)1000372Fig. 1. 蛋白质、配体及其相互作用的图形表示。基于蛋白质-配体复合物的结构,图表示编码蛋白质-配体复合物的结构。(A)配体(红色节点,边缘),(B)蛋白质更多细节请参见Volkov et al. [4]。这幅图是经Volkov,M.许可重印的; Turk,J.A.; Drizard,N.; Martin,N.; HoBertmann , B.; Gandel-Mathé; Rognan , D. 用 深 度 神 经 网 络 从 蛋 白 质 - 配 体 结 构 预 测 结 合 能 力 的 挫 折 。 2022 年 医 学 化 学 杂 志 。 doi :10.1021/acs.jmedchem.2c00487。出版中。版权所有2022美国化学学会。J. 巴约拉特生命科学中的人工智能2(2022)1000373配体相似性预测主要是通过记忆来自训练数据的模式来驱动的,其中配体相似性关系起主要作用。作者还表明,通过包括更长距离上的更多相互作用来增加相互作用图的复杂性,进一步提高了I模型的预测准确性。这一观察得出的结论是,剥夺了额外的蛋白质或配体背景信息的相互作用模型应该为进一步探索深度神经网络学习蛋白质-配体相互作用的能力提供合理的基础。与之前的其他人一样,作者还强调,目前高质量和多样化的蛋白质-配体复合物数据的稀疏性对于化合物效力预测和基于结构的药物设计,像Rognan和同事们这样的仔细研究所提供的见解具有根本的相关性,将假定的方法论进步纳入科学的视角,提高对潜在过度解释的认识,并平衡期望。此外,对于整个生命科学领域的深度学习,研究表明当前方法的局限性以及对结果的潜在警告或误解对于该领域的进一步发展与方法学突破一样重要。竞争利益作者声明,他们没有已知的竞争性经济利益或个人关系,可能会影响本文报告的工作。引用[1] 何克,张X,任S,孙杰,深度残差学习图像识别。在:IEEE计算机视觉和模式识别会议的开幕式上; 2016年。p. 770-8[2] 熊俊,熊志,陈凯,姜宏,郑明.用于自动化从头设计药物的图形神经网络今日药物发现2021;26:1382[3] GilmerJ,Schoenholz SS,Riley PF,Vinyals O,Dahl GE.量子化学的神经信息传 递 。 In : Proceedings of the 34th International Conference on MachineLearning,70; 2017. p. 1263-72.[4] Volkov M.,土耳其人,德里扎德·N马丁·N何世文,加斯顿M.,Rognan D. 用深度神经网络从蛋白质-配体结构预测结合能力的挫折2022年医学化学doi:10.1021/acs.jmedchem.2c00487,出版中。[5] 王R,方X,陆Y,王S. PDBbind数据库:具有已知三维结构的蛋白质-配体复合物的结合能力的集合。 医学化学杂志2004;47:2977-80.[6] 杨俊,沈春,黄宁.预测或假装:蛋白质-配体相互作用的人工智能缺乏足够大和无偏见的数据集。2020年11月69日。[7] 王J,Dokholyan NVYuel.提高无结构化合物-蛋白质相互作用预测的普适性JChem Inf Model 2022;62:463[8] Chen L , Cruz A , Ramsey S , Dickson CJ , Duca JS , Hornak V , Koes DR ,Kurtzman T. DUD-E数据集中隐藏的偏见导致深度学习在基于结构的虚拟筛选中的误导性表现。PLoS One2019;14:e0220113.[9] Nguyen T,Le H,Quinn TP,Nguyen T,Le TD,Venkatesh S. GraphDTA:用图神经网络预测药物-靶标结合亲和力。生物信息学2021;37:1140-7.[10] 瓦拉赫岛大多数基于配体的分类基准奖励备忘录化而不是概括化。JChem InfModel 2018;58:916
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- zigbee-cluster-library-specification
- JSBSim Reference Manual
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功