基于形状的蛋白质对接算法设计与工程

162 浏览量更新于2024-01-22 收藏 965KB PDF 举报

身份认证购VIP最低享 7 折!

30元优惠券

可在ScienceDirect上获得目录列表计算设计与工程杂志首页：www.elsevier.com/locate/jcde计算设计与工程学报5（2018）180一种新的蛋白质-蛋白质对接哈里湾Vorugantia，Bhaskar Dasguptaba印度Telangana州Warangal国家理工学院机械工程系，邮编506 004b印度北方邦坎普尔印度理工学院机械工程系208 016阿提奇莱因福奥文章历史记录：2017年5月15日收到2017年10月22日收到修订版2017年10月22日接受2017年10月31日在线提供保留字：评分函数形状匹配归一化体积错配蛋白质对接A B S T R A C T分子对接的问题是预测两个给定的分子是否结合在一起进行相互作用。提出了一种基于形状的预测对接算法，指出两个分子的外表面之间的形状互补性是两个分子结合所必需的提出了一种分五个阶段的方法来寻找形状互补性最大的位姿它涉及表面生成，分割，参数化，形状匹配，过滤和评分。本文最重要的评估后，它被发现，与局部形状互补性作为唯一的标准，该算法是能够预测的构象接近确切的，在已知的对接构象的情况下，也排名相同的前40名的解决方案。考虑到许多现有的对接方法未能将近天然构象排在前50个解决方案中，这是值得注意的基于形状的方法用于对接的初始阶段，以识别一小组候选解，以进一步进行详尽的能量研究等。捕获正确构象的能力，作为排名靠前的几个候选解决方案是这个新的预测对接算法的最有价值的方面。©2017计算设计与工程学会Elsevier的出版服务这是一个开放在CC BY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）下访问文章1. 介绍蛋白质是一类生物分子。由于它们的结构、催化和运输特性，它们对所有生物体都是必不可少的细胞内的许多生化过程都涉及某种分子间的相互作用。其中一些是细胞信号传导、酶功能调节、细胞内运输、转录调节、免疫应答等。蛋白质分子与其他分子相互作用以执行其功能。分子的生物化学已经用实验研究了许多年。随着X射线晶体学和核磁共振（NMR）技术的发展，测定分子结构的速度越来越快。为了更好地理解蛋白质的结构与功能之间的关系，实验研究蛋白质与数据库中大量其他成员的相互作用几乎是不可能的。由计算设计与工程学会负责进行同行评审。*通讯作者。电邮地址： harikumar@nitw.ac.in （香港）Voruganti ）， dasgupta@iitk.ac.in（B.Dasgupta）。由于实验瓶颈的存在，到目前为止，在蛋白质数据库（PDB）中可用的结构中，只有大约5%属于这种预测率在未来将大幅提高，这似乎是不可能的（Ritchie，2008）。因此，对于分子相互作用的预测，计算方法正成为越来越重要的替代方案。这种研究被称为分子对接，通常解决以下问题。给定一对分子的原子坐标，预测它们是否结合并形成复合物。如果他们这样做了，请识别姿势。拟议的方法是试图回答这个问题。两种蛋白质之间的相互作用由对接构象或姿态的动力学和稳定性控制。位姿的稳定性取决于表面静电和表面形状互补性。姿势的能量稳定性可以通过从溶剂中排除的表面积的量来近似，该表面积近似为两个表面互补的总面积换句话说，对于两个分子之间的相互作用，形状互补性是必要条件，尽管还不够。https://doi.org/10.1016/j.jcde.2017.10.0032288-4300/©2017计算设计与工程学会Elsevier的出版服务这是一个在CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）。H.K.沃鲁甘蒂湾Dasgupta/ Journal of Computational Design and Engineering 5（2018）180181¼ra-rb;当参与分子对接的两个伙伴是蛋白质时，称为蛋白质-蛋白质对接。另一方面，如果一个是蛋白质，另一个是配体（小分子），则称为蛋白质-配体对接。由于蛋白质是与配体互补的大分子，因此在蛋白质-蛋白质对接的情况下，形状互补性比蛋白质-配体对接起更重要的为了方便起见，组成蛋白质通常被称为受体（通常是较大的受体）和配体。有两种类型的对接问题：绑定和未绑定。结合对接是一个更简单的问题，其目的是使用受体和配体的“结合”结构重建复合物。结合结构是从多于一个分子的结构中提取的，通常是受体和配体的共晶体。然而，在“未绑定”对接的情况下，目标更加困难。它涉及使用受体和配体的未结合结构构建复合物。停靠算法通常在应用于未绑定情况之前使用绑定情况进行评估。通常，结合对接用于基准测试目的，因为复合物和组成分子的结构可用于计算RMSD。RMSD、均方根偏差或均方根误差通常用于测量复合物的预测结构的原子坐标与结合复合物的结构之间的差异。这项措施本文也采用了。除了分子生物学，匹配两个形状（刚体）的问题引起了计算机视觉等各个领域的极大关注。计算机视觉和模式识别背景下的表面匹配方法可以在Wolfson（1990），Besl和Jain（1985），Huang，Flöry ， Gelfand ， Hessel 和 Pottmann （ 2006 ）， Li ， Kim ，Huang和He（2010）以及Li，Larson和Hanjalic（2015）中找到。两个对象的表面匹配或形状匹配涉及找到应用于其中一个对象所需的最佳变换（旋转和平移），以便它们具有良好的匹配并且像拼图一样适合。因此，最佳形状匹配是一个搜索问题。但设计一个合适的准则作为搜索的依据比搜索算法本身更重要。这样的标准通常被称为评分函数。在本文中，我们提出了一个新的评分函数命名为归一化体积失配。在介绍我们的工作之前，在下面的部分中简要回顾了为蛋白质对接对于详细的综述，可以查阅综述文章（ Elcock ， Sept ，&McCammon ， 2001; Halperin ， Ma ， Wolfson ， Nussinov ，2002;Mendez，Leplae，De Maria，Wodak，2003; Ritchie，2008;Sternberg，Gabb，Jackson，1998; Via，Ferrè，Brannetti，Helmer-Citterich，2000年）。对接方法中采用的搜索策略包括蛮力枚举（Walls& Sternberg，1992 ）、快速傅立叶变换（ Chen&Weng ， 2002; Heifetz ，Katchalski-Katzir ， &Eisenstein，2002; Katchalski-Katzir 等人，1992 等）、遗传算法（ Jones ， Willett ， &Glen， 1995; Jones ，Willett，Glen，Leach，&Taylor，1997）、蒙特卡罗方法（Liu&Wang，1999; Trosset&Scheraga，1999）、局部形状特征匹配算法（Connolly，1986; Kuntz等人，1982; Lin，Nussinov，Fischer，&Wolfson，1994; Norel，Lin，Wolfson，&Nussinov，1994），几何散列（ Fischer ， Lin ， Wolfson ， &Nussinov ， 1995;Lamdan&Wolfson，1988; Wolfson，1990）等。匹配算法通常会产生大量的候选解.需要标准或评分函数来评估/评分和过滤解决方案。关于对接的评分函数有几篇综述（Halperin等人，2002年; Schneider&Böhm，2002年; Smith& Sternberg，2002年）。现有的评分函数可以分为两类：经验评分函数和基于知识的评分函数。在经验评分函数中，加权交互的总和用作评分的标准。基于知识的评分函数使用Boltz-mann定律的逆公式推导（Schneider Böhm，2002）。该技术用于导出形成能量函数的原子对势的集合，通过有利于优选的接触和不利的排斥相互作用。各种方法在用于获得这些电势的蛋白质-配体复合物的集合、能量函数的形式、原子类型的定义、距离截止值等方面有所不同。Scoring函数通常使用一些参数的组合，例如范德华相互作用、形状互补性、静电、疏水性、去溶剂化、原子接触能等。尽管有许多进步，但许多评分函数通常无法区分对接方案产生的正确解和假阳性。由于分子的灵活性，它们在结合的情况下表现良好，有时在未结合的情况下失败（Halperin等人，2002年）。因此，评分函数应适应构象的微小变化，并且不应允许轻微的穿透（空间冲突）过多地影响评分用于柔性蛋白质-药物对接的算法（其产生非常精确的复合物而没有大的空间冲突）使用范德华势能作为量度（Jones等人，1995年，1997年）。范德华势能由Lennard- Jones方程EX.Aij Bi j！1i;jIJIJ2. 文献综述第一个自动对接算法是由Wodak和Janin（1978）在1978年开发的，以研究牛胰蛋白酶与其天然抑制剂之间的相互作用但正是Kuntz、Blaney、Oatley、Langridge和Ferrin（1982）构想的称为DOCK的对接程序激发了对接领域的进一步研究。然后，一些算法已被提出，分子对接已成熟为一个独立的计算学科。一个典型的对接套件包括三个模块。他们是(a)分子的表示，（b）构象空间搜索和（c）评分的潜在的解决方案。分子表面有多种表现形式（Connolly，1996）。其中包括探针球表示、Connolly解析曲面、溶剂排斥曲面（SES）、球面调和函数等。本文用SES表示蛋白质表面，并使用MSMS程序（Sanner，Olson，Spehner，1996）。其中rij是原子i和j之间的距离;Aij和Bij是吸引和排斥参数，a和b是吸引和排斥指数。由于该函数依赖于距离在两个分子的原子之间，匹配步骤的结果对于评分来说是不准确的。在蛋白质-蛋白质对接的情况下，其中许多侧链被扭曲，形状互补性通过软化的评分函数来检查。不同的方法被开发来计算软范德华势。一些算法使用分子的网格表示来评估相互作用区域的程度（Chen&Weng，2002; Katchalski-Katzir等人，1992; Vakser，1996; Walls &Sternberg，1992）。空间冲突将受到惩罚。评分函数有利于表面体素之间的相互作用，而与内部或核心体素的相互作用是不利的。评分函数可以被计算为FFT相关性。称为FADE的对接程序使用分子的原子密度来评估形状互补性（Mitchell，Kerr，TenEyck，2001）。该方法还使用FFT来加速评分。182H.K.沃鲁甘蒂湾Dasgupta/ Journal of Computational Design and Engineering 5（2018）180¼ð Þ ðÞ在Norel等人开发的几何算法中，（1994）和Fischer等人（1995）中，使用网格表示分子。用配体分子的表面点访问受体网格，并将得分计数为表面、外部和核心体素交叉点的加权函数另一种方法是根据离分子表面的距离将受体分成壳层。 Norel等人提出的方法。Duhovny，Nussinov，and Wolfson（2002）使用距离变换网格将（1994）进行了推广并使其更加精确。他们将受体分为许多壳层，得分是每个壳层中配体表面点数量的加权函数在Lenhof（1997）提出的方法中，形状互补性通过计数由来自两个分子中的每一个的一个原子组成的接触原子对的数目如果两个原子之间的距离在2.75- 4.0埃的范围如果距离小于2.75，则会对重叠施加 Kim等人（2011）提出了一种基于b-络合物的受体和配体对接的新方法。利用b形快速找到结合位点的近似位置，并以此作为遗传算法的初始猜测，以寻找最优解。综述了一类称为方法组合的方法，Vajda和Kozakov（2009年）报告了用于对接的臭氧消耗物质。Hwang，Vreven，Janin，and Weng（2010）为研究社区提供了一个新版本的蛋白质-蛋白质对接基准。对接过程中构象变化起着重要作用Zacharias（2010年）对这方面进行了研究，并得出了结果。Kozakov等人（2013）和Huang（2015）最近对对接的自动化方法进行了评估。从文献中可以清楚地看出，尽管已经提出了许多用于蛋白质-蛋白质对接的方法，但没有一种方法在每种情况下都是有效的这是因为即使他们遇到正确的构象，也无法识别它。因此，需要一种更好的评分函数，其至少可以将近原生解决方案排在前100个解决方案中。通过引入基于体积的评分函数，提出了一种新的基于形状的对接方法。3. 对接方法学作为基于能量的方法的替代方案，基于形状的方法用于对接的初始阶段，以确定候选解决方案，然后可以对这一较小的解决方案集进行详尽的能量研究。提出了一种基于几何的五阶段方法来解决蛋白质-蛋白质对接问题。现概述如下。分子被表示为一组重叠的球体M。组成原子的范德华半径被认为是每个球体的半径溶剂可擦曲面（Solvent Dissolvable Surface，SAS）是一组球面M0的拓扑边界，它是由球面M通过将每个球面的半径增加值rp（探针半径）而得到的。可以得到一个光滑的分子表面，它由位于原子或探针上的球形贴片和探针在成对原子上滚动时所定义的环形贴片组成。由于这可能导致自相交的表面，所有可能的探针与M没有相交的并集的拓扑边界被定义为溶剂排除表面（SES）。1. 表面生成：这种方法所需的唯一信息是与所研究的蛋白质对相对应的两个PDB文件的集合两种分子的溶剂排除表面（SES）使用MSMS程序产生（Sanner等人，1996年，以三角形的形式。2. 分割：计算两个蛋白质表面的每个顶点的曲率。两个曲面都被分成一组具有均匀曲率的开放曲面片。3. 参数化：每个曲面片通过B样条建模参数化，以获得相同的连续和紧凑的表示。每个曲面片现在都用一组B样条控制点表示。4. 形状匹配：将一种蛋白质的互补块与另一种蛋白质的互补块进行匹配，以估计形状互补性/评分函数，该函数是两个块之间匹配质量的度量5. 评分和过滤：由于匹配是在本地执行的，因此进行空间冲突检查。对解进行过滤和排序。排名靠前的解决方案是两种蛋白质之间可能发生对接相互作用的最佳姿势！Voruganti和Dasgupta（2009年）较早报告了前三个准备阶段，即表面生成、分割和参数化。本文报道了最后两个也是最关键的阶段，在这两个阶段中，一个蛋白质（受体）的凸和凹补丁将分别与另一个蛋白质（配体）的凹和凸补丁匹配，以找出蛋白质对可以结合的最佳变换。在下面的章节中，讨论了一对曲面片和所提出的评分函数。4. 曲面片的最优形状匹配显然，当两个曲面片在性质上互补时，例如一对凸曲面片和一对凹曲面片，它们可以匹配受体的所有凸块和凹块分别与配体的凹块和凸块匹配。尽管存在鞍形补片，但由于两个原因，它们也不被认为是识别可能的对接姿势：1. 活性位点大多位于凸/凹区（Connolly，1986; Duhovny等人，2002年），以及2. 尽管一对鞍形补片可以匹配，但是这种构造最可能由凸-凹或凹-凸匹配共享。匹配两个曲面片的问题可以表述如下。给定两个曲面片S1u1;v1和S2u2;v2，找到最佳变换，该变换将产生它们之间的最佳匹配。形状匹配问题涉及到测量构象中一对曲面片之间的“匹配质量”。通过提出一种新的基于体积的评分函数对其称为归一化体积失配（Vω），其测量两个表面片之间的间隙/侵犯。如果没有间隙即Vω0，则它是完美匹配。得分函数的值越低，匹配的质量越好。找到一个最佳变换，使Vω的值最小，无限的可能性是一个六维搜索问题。但它如果在匹配之前对两个面片都进行参数化，则可以简化为四维问题，因为每个表面将仅根据“两个”参数可用这里，这种参数化由方法的前三个阶段提供（Voruganti Dasgupta，2009）。直观地说，匹配涉及到将一个曲面片放在另一个曲面片上，并测量它们之间的间隙在搜索时，每个候选变换给出两个曲面片接触的新接触点这样的接触点本质上是为四个参数指定值的结果-每个曲面片两个换句话说，H.K.沃鲁甘蒂湾Dasgupta/ Journal of Computational Design and Engineering 5（2018）180183ðÞð Þ¼ð Þ ðÞ第三章找到最佳变换矩阵等同于找到给出评分函数的最小可能值的一对接触点。执行优化以找到这四个参数的最佳集合曲面片在通过对齐相反的曲率方向和表面法线来计算Vω一个曲面的最大曲率方向与另一个曲面的最小曲率方向对齐，反之亦然。此外，凹（凸）片的表面法线与坐标系的正（负）z轴对齐。该过程在A中描述。5. 归一化体积不匹配假设两个曲面片S1和S2在接触点位于C和一个公共切平面的构形中结合在在当地邻居的每个补丁上的点-在切平面上，C的hood可以用r;h表示，如图 2所示。1.一、匹配程度：这两个曲面片的特征在于两个标准：两个表面补片之间的不匹配体积（V）或间隙/侵犯，以及● 匹配范围（R）。例如，一对曲面片可以非常好地匹配，其中它们之间的失配体积较小，但是在小区域（低V和低r）上。另一对曲面片可能匹配不好，但这种匹配在大区域（高V和高r）上理想情况或完美匹配将具有较低的V值和较高的r值，即在大区域上的良好匹配。如何区分这些案件？为了实现这一点，一个新的评分函数，称为归一化体积失配的形状匹配的这两个方面相结合的建议。归一化体积失配被定义为两个表面之间截留的固体体积与临界半径的立方的比率该评分函数是无量纲的，并且与用于表示曲面片的尺度无关。它是由S2S1Fig. 1. 两个曲面片S1; S2接触c。图二. Vr相对于半径的变化5.1. 临界半径的确定如图 2，临界半径rω是函数Vr的极小点。寻找临界半径涉及在r中的线搜索。由于各个贴片在曲率上是定性均匀的，即，单个片在整个范围上具有相同的曲率符号，即使曲率“值”可能变化，目标函数也是单峰的在r中的一维搜索可以使用简单的方法有效地执行，例如，黄金分割VωVrω3其中rω是临界半径，V是失配体积。ð2Þ搜索最小化问题陈述如下。尽量减少武尔河在的间隔（r min;rmax）。不是在r^0处开始搜索rω，而是从可以计算一对曲面片的体积不匹配使用Z2pZrVdh00因为有两个原因，所以取r min0：3。第一，未定义为r/0。其次，一对曲面片，rω0： 3 π没有实际用途。<1这里，rmax是两个曲面片共同的最大可能半径，它是其中dh^jdzj是半径（q）处垂直坐标的绝对差，dq是半径的小增量，dh是半径的小增量。角度使用等式3，函数Vr可以表示为从接触点到曲面片的所有八个边界的距离。对应于最小Vr的r值是临界值，1ZZ半径rω和在rω处的V<$r<$的值，即归一化体积误差matchVω¼Vωrω是曲面片对的得分为了说明V相对于半径的变化，在图2中示出了示意图。较低的V值表示良好的匹配。在这种情况下，随着r的增加，函数V将减小V和r之间的曲线是下降的。但如果匹配是不完美的，并且仅在达到某个半径值（例如，rω）时存在良好的匹配，则所绘制的曲线将是下降的曲线直到rω，然后是上升的曲线。该值rω被视为临界半径。因此，在Eq. （3）只计算到rω的这个值。归一化的体积失配是从第一原理计算的，通过添加体积失配的小条的dq直到所需的半径。6. 最佳接触点找到用于匹配一对贴片的最佳接触点的问题可以陈述如下。对于一对曲面片（S1u1;v1 ），求出（u1;v1;u2;v2 ）的最优值和S2u2;v2），使得归一化体积失配Vω最小。1已经发现，其他值如rmin1/40： 1; 0： 2等不会产生任何更好的结果。●C2CR拉克什dh184H.K.沃鲁甘蒂湾Dasgupta/ Journal of Computational Design and Engineering 5（2018）180博博博[1/2]（1，如果不超过0;最小值<（0，如果不超过0;最小值<（0，如果不超过0;最小值<博¼博[1/2]¼þDV变量向量是Xu1v 1u2v2. 对于任意X，函数V可以以两种方式之一（随r）变化。首先，当一对面片之间不存在匹配时，V沿着半径r增加（即dV>0）。第二，如果有一个很好的匹配达到某个半径值，只有在开始时V才减小（即dV0）。<在上述两种情况中，第一种情况是不可行的（对于Vω），并且应该受到惩罚，因为这样的X选择是不可接受的-有能力。在第二种情况下，即当dV为0时，存在匹配。<为了找到匹配的范围，在r中执行搜索。考虑到上述情况，数学上，优化问题如下所述。7. 为了找到对应于最小值的点Xopt，利用Vω，Nelder和Mead8. 在Xnew处，通过以下步骤2-6计算Vω9. 重复步骤2-对应于Vω的最小值的变量向量X是最优解Xopt。注意，在此X_opt处，应用于贴片对的变换是用于受体和配体的对接的候选变换，表面贴片从所述受体和配体对接。最小化fw Vωwdvrw V r提取。使用该算法，所有互补对的5¼1þ 2陈博士3分钟后，受体和配体的斑块是匹配的。其中w1;w2;w3是权重。权重由下式给出：8.过滤和评分w1¼w2¼w3¼dVdr否则为0;dVdr10否则;dVdr1其他：ð6Þð7Þð8Þ如前所述，并非所有互补贴片对都显示匹配。因此，在通过形状匹配阶段处理了受体和配体的所有互补补丁对之后，丢弃不显示可接受匹配的对。在尝试对一对面片进行形状匹配后，该算法将报告下面列出的三种结果之一这个加权目标函数帮助我们远离不可行区域（即，一个区域，在该区域中，dVr min P 0）到可行的区域（即，其中dV_r_min_r_0的区域），从而改善了<性能7.完整形状匹配算法下面简要概述了用于一对贴片的最佳形状匹配的整个算法。注意，Nelder和Mead1. 生成一个初始单纯形的n1顶点（n是搜索空间的维数）。在这里，N4。其中一个顶点以X 0： 5 0： 5 0： 5 0： 5作为初始猜测进行初始化，其他顶点通过沿坐标扰动由此生成。nate axes.2. 目标函数Vω在单形的每个顶点处求值。对于一个顶点X，利用控制点计算一对接触点（q1;q2）。3. 这两个曲面片都被平移以得到点q1和q 2。q2重合（使用等式A.1和A.2）。4. 在相同的X，旋转所需的对齐补丁对计算对齐曲率方向使用方程。A.7和A.8。5. 这些旋转应用于两个曲面片（使用方程：A.9和A.10）。6. 在该对准处，通过找到临界半径rω来计算归一化体积失配Vω，其具有以下步骤：(a) 在rmin6r6rmax上进行线搜索.一开始，V在r rmin处进行评估。(b) 使用搜索算法（这里是黄金分割搜索）生成r的新值，并在r/rnew处评估V。(c) 当前和先前迭代的V值是一致的，并且保留最佳r(d) 重复步骤（b）和（c）直到搜索算法收敛。在收敛时，r的最佳值1. 该算法收敛与一个成功的匹配和价值-报道了Vω和rω2. 由于整个搜索域中的rmaxrmin<3. 的算法并不找到一成功匹配，因为在整个搜索域中，dr_r_min_r> 0其中补丁对表现出成功匹配的转化是相应受体和配体可以结合的潜在构象第二种和第三种情况是局部形状互补性的缺乏，尽管“定性”互补曲率的实例存储对应于第一类结果的变换并基于Vω的值进行排序。这组转换可能包含一些可能导致受体和配体之间的空间冲突。已目视检查空间冲突，并丢弃不可接受的转换。在该过滤之后，剩余的变换列表用于形成复合体。这种建议的复杂性已被验证，通过计算预测和已知的结合复杂，只要可用之间的RMSD。不用说，在所有这些阶段的丢弃inva- lid解决方案，剩下的是一个入围名单和最后一轮淘汰仍然是由于。本文件的意图是有限的，可以通过形状一致性只实现最好的。除此之外，最终的解决方案只能通过能量来确认，这超出了本文的范围，但它努力提供非常好的初始解决方案。9. RMSD和贴近度估计如果TA和TB是为了最佳形状匹配而应用于受体（A）和配体（B）的变换，则相同的变换应用于两个分子的Ca原子2这个变换将导致复形AB，接触点在原点。Ca原子的变换坐标对应于最小值V<$r<$是rω，函数值图2蛋白质分子的几何结构被其C原子本身。因此，对于它本身就是Vω。一RMSD计算，仅考虑Ca原子H.K.沃鲁甘蒂湾Dasgupta/ Journal of Computational Design and Engineering 5（2018）180185一C0000aBC0aA¼ TA CaA;9C0aB¼ TB CaB;100磅其中CaA和CaB分别是A和B的Ca为了使复形AB具有约束结构C，需要应用以下变换10.1. 束缚对接对应于蛋白质-蛋白质复合物的10种选定结合情况的结果总结见表1。还报告了每个病例的分期结果。第一阶段（表面生成）的输出是三角形SES。C00aA 联系我们公司简介ð11Þ第5列和第6列中分别报告了面数和顶点数。算法的第二阶段（分割）产生C0a0B¼T-A1C0aB¼T-A1TBCaB：1012磅从上述两个变换中，分子A变换回其原始位置。因此，00与结合络合物CaB<$Ca的Ca原子的相应坐标的关系表明预测的误差。这两组坐标之间的RMSD由下式给出：vu1XnSES的表面补丁。第7列和第8列分别报告了凸形和凹形贴片的数量。第三阶段（参数化）的输出是一组对应于每个曲面片的控制点。在这里报告所有数据并不重要，也不可能所有的互补块都用形状匹配算法进行处理第9列显示了处理的补丁对的数量。第10列中记录了成功的贴片对数量。最小构象的秩、得分和临界半径RMSDCaB; CaBCtn1/1kCaBi-CaBCik;13RMSD分别显示在第11、12和13栏中。如前所述，使用RMSD迷你模型验证了预测结果RMSD是笛卡尔空间中的度量。或者，偏离也可以在构象空间中测量9.1.构象空间为了估计从预测的构象实现结合复合物的构象所需的努力，即旋转和平移的量，即为了找出所提出的算法的预测与构象空间中的结合结构有多接近，执行RMSD最小化。以结合复合物与预测复合物之间的偏差为目标函数，以代表构象的六个参数为变量，即三个旋转（a;b;c）和三个平移，（x;y;z）作为变量。优化问题如下。最小化RMSDCaABv; CaC，边界为hl6a;b;c6hu和tl6x;y;z6tu。在结合对接的情况下使用值hl1/4 -0： 15和hu 1/40：15，在未结合对接的情况下使用值hl 1/4 - 0： 25和hu 1/40：类似地，对于结合对接，取t1/4 -3和t1/4 -3，对于未结合对接，取t1/4- 5和t1/4 -5可变最优化的向量是[v/2abcxyz]。10. 蛋白质-蛋白质对接结果所提出的对接算法进行了测试对接基准和结果的许多情况下，其中一些报告在这里。它接受一对PDB文件作为输入，并提供一个构造列表。在所有情况下使用的参数是相同的。对接程序在台式计算机（Inteli7处理器，8 GB内存）上运行。平均运行时间约为15-45分钟，取决于分子的大小。复合体结构的最终结果或预测取决于多种因素。其中一些列在下面。活性部位的形状：由于形状互补性更显著，因此更容易和准确地确定界面区域是否为凸/凹。分子的大小：分子越大，补丁级匹配结果的数量越高，因此计算成本越高。构象变化：由于该算法是将蛋白质视为刚体而开发的，因此每当构象变化涉及缔合时，RMSD将很高。异化。最小化之前的误差、旋转和平移所需的调整、最小化之后的误差分别报告在第14、15和16栏中。为了理解结果，让我们更仔细地研究PDB ID：1MAH的复合物的情况。预测的方向向量为半-0：5642 0： 0984-0： 1325]弧度位置向量是电话：+86-28-4329-695122： 6387]而在导致RMSD为0.974 μ m的RMSD最小化之后的对应向量为半-0：4642 0： 0561-0： 0964]弧度和电话：+86-26-4329-495123： 860]这些向量的差的范数给出了预测结果与边界复合体的接近程度的概念。在RMSD最小化之前和之后的方向向量的差的范数为0.114 rad，并且位置向量的相应值为3.00 rad。如表1的第11列所示，建议的评分函数将具有最小RMSD的构象排列为第5位。为了清楚地看到C a原子之间的偏差，预测的和结合的Ca原子一起绘制在图1中。3 .第三章。平均而言，为了获得结合构象，所需的方向校正为6-这种小幅度的校正可以通过能量最小化过程来实现，对于该能量最小化过程，预测的一致性将可用作非常好的初始起始点。结果表明，该对接算法能够以形状互补性为唯一准则预测出与边界结构非常接近的结构。请注意，从复合物中分离的单个蛋白质在补丁水平上进行了正式处理，并且在排名之前的任何阶段都没有使用它们在原始复合物基于Vω。因此，该过程完全遵循将问题视为预测对接的问题，即使数据已从综合体中获取，以便在最后进行验证。●●●2aA186H.K.沃鲁甘蒂湾Dasgupta/ Journal of Computational Design and Engineering 5（2018）180表1结合蛋白-蛋白复合物的结果。SL.PDB ID编号SES的细节段形状匹配分数RMSD最小化号原子面bVertcCVdCCETf Fg排名hVωrωe1idh;dtje 2k（一）(2)（三）(4)（五）（六）（七）（八）（九）（十）（十一）（十二）（十三）（十四）（十五）（十六）11MAH 1J064116 6858234287622801650.0790.95012.4060.11，3.000.971FSC461 12，11660602621E6E 1E1N三五七二四二九九四21,49517671350164100.0661.99914.2130.12，2.891.231CJE874 11，9025953104031AY7 1RGH751 10，57652902199814100.0160.30011.5460.14，2.430.931A19738 9068453623041TMQ 1JAE3606 33，15816,58174148550130.0820.41013.7430.12，2.212.631B1U881 11，286564554051NCA 1NCA3330 40，07620,03419701523100180.0210.65014.1110.21，2.873.027NN93075 12，1166060287561NSN 1NSN3283 40，68020,32873716332160.0271.45012.2780.16，1.922.341KDC一千一百零八一万五千六百三十八782111871PPE 1BTP1629 18，2209110112922746120.0540.67111.451零点一二，二点五二1.741LU0222 4000200211881F34 3PEP2433 27，39613,96473876262180.0481.21012.5170.11，1.992.241F321076 16，844842496091I2M 1QG41346 17，9348697533142374160.0630.76213.2410.13，32.251A122899 3159815,7973180101ATN 1IJJ二九一零三万三千一百二十16,5561057109051180.0930.84514.7540.15，3.002.893DNI2035 20，66410,3201052复合物（第2列）、受体和配体（第3列）的PDB ID。bSES三角测量中的面数cSES三角测量中的顶点数d通过分割产生的凸曲面片的数量e通过分割产生的凹曲面片的数量f在形状匹配中处理的补丁对的总数g过滤后剩余的补丁对总数h具有最小RMSD的构象的等级。i预测复合物和结合复合物之间的RMSD。j为获得束缚结构所需的方向和位置校正。k优化复合物和结合复合物之间的RMSD。预测界限180175170165160155252015105X0−5−1040253530y2015图三. 以PDB-ID：1 MAH为例，计算了预测和结合配合物配体的Ca10.2. 自由对接在未结合对接中，受体和配体的结构以其天然状态可用，其在其缔合期间可能经历由于缔合中涉及的构象变化，与结合对接相比，未结合报告了12例未结合蛋白质-蛋白质复合物的检测详情。表2中给出了相同的总结。与约束情况一样，使用RMSD估计接近度最小化过程对于所有报告的病例，复合体的结构可用，因此可以计算RMSD如表2所示，实现精确结构所需的校正与约束情况相比更高，平均RMSD也是如此。这是预期的，考虑到蛋白质被建模为刚体，并且形状被用作对接的唯一标准即使有这样的假设，预测也接近最终的构象。为获得正确的构象，在方向和位置上所需的平均校正约为13度和4度角。在所有情况下，zH.K.沃鲁甘蒂湾Dasgupta/ Journal of Computational Design and Engineering 5（2018）180187表2未结合蛋白质-蛋白质复合物的结果。SL.PDB ID编号SES的细节段形状匹配分数RMSD最小化号原子FacVertCvCcTF秩bVωrωe1 cdh; dt de2 e（一）（二）（三）（四）（五）（六）（七）（八）（九）（十）（十一）（十二）（十三）（十四）（十五）（十六）11EAW1EAX186421,43210,71664314227120.0230.5213.7650.21，3.425.2399PTI4467114355922831CGI2CGA179921,52210,76383631281200.0311.2021.2190.22，4.456.3311HPT4417172358823031BUH1HCl237229,38614,6931162852312360.0010.4520.1200.25，4.116.3311DKS6509820491273841KLU1H15304537,29218,6461657176595200.0290.9219.4200.23，3.894.871STE190222,67011,337136451UDI1UDH182622,14611,075735441134320.0531.0216.1260.17，3.755.902UGI6549766488353862MTA2BBK373739,34419,670116967586240.0710.8723.540.15，4.596.792RAC8079732486853072PCC1CCP262424,65212,32693048356270.0691.3118.540.23，4.945.891YCC84711,360568053781HIA2PKA180120,35810,17973237091240.0910.6220.120.16，5.005.121BX83556876344053091QFW1QFW176221,65410,827539803122350.0831.2221.430.14，4.644.831HRP152521,50410,7521267101FAK1QFK275132,94416,46815601047143370.0451.3122.510.13，56.831TFH147728,75014,3751265111KKL1JB1118147,87823,917245449189330.0561.2719.650.11，4.814.212HPR62585884296216121KXQ1KXQ390837,17018,585164634871280.0371.4518.210.12，3.825.671PPI91511,1065555216a所有栏

下载后可阅读完整内容，剩余1页未读，立即下载

cpongm

粉丝: 5
资源: 2万+

基于形状的蛋白质对接算法设计与工程

分子对接的原理-方法及应用.docx

分子对接的原理,方法及应用 (2).docx

分子对接的原理,方法及应用.docx

轨迹对接航天器控制器算法

autodock蛋白与蛋白对接

java 实现ocr识别对接算法

电信aep平台对接工程

linux zdock

前端工程师怎么对接项目

基于 WIFI 的定位系统的设计与实现

卫星系统算法课设matlab

基于fpga的卷积编码与译码器设计

haddock docking method

行人属性识别对接yolov5算法步骤

基于php的图书销售系统设计与实现

对接第三方SDK，需要用自己的那个工程去对接

在毫米波雷达信号处理中，怎样对信号进行基于霍夫变换的非相参累积算法处理

盲均衡算法的基本原理

.Net Core 与WMS如何进行数据对接

最新资源