使用图卷积网络预测蛋白质相互作用的结构感知方法

需积分: 0 0 下载量 94 浏览量 更新于2024-08-04 收藏 1.61MB PPTX 举报
"SGPPI 是一种利用结构感知预测蛋白质-蛋白质相互作用的方法,它结合了图卷积网络和多种蛋白质结构与进化信息。该方法考虑了蛋白质的二级结构、残基进化信息以及全局和局部几何特性,以提高预测的准确性和严谨性。" SGPPI,全称为“Structure-aware Prediction of Protein–Protein Interaction”,是一种先进的预测技术,旨在精确地预测蛋白质之间的相互作用。这一方法特别关注蛋白质结构的信息,以增强预测能力。在生物学中,蛋白质-蛋白质相互作用(PPIs)是生物体内的基本过程,对细胞功能和许多生物过程至关重要。 SGPPI采用了图卷积网络(Graph Convolutional Network),这是一种深度学习技术,能够处理非欧几里得数据,如蛋白质网络。通过这种网络,可以有效地捕捉蛋白质结构的复杂性,并识别出可能的相互作用模式。 在SGPPI中,有几种关键的特征编码被用来描述蛋白质结构和进化信息: 1. **位置特异性评分矩阵(PSSM)**:PSSM提供了一种量化蛋白质残基进化的手段,通过比较蛋白质的多个同源序列来获取。PSSM的每一列代表一个氨基酸位置,行则表示20种不同的氨基酸,给出每种氨基酸在该位置出现的概率。 2. **蛋白质二级结构特征(JET2features)**:包括α-螺旋和β-折叠的长度、数量、标准差,氢键的数量和距离,以及其他二级结构的统计信息。这些特征帮助捕捉蛋白质的二级结构特征,这对于理解蛋白质的结构和功能至关重要。 3. **One-hot编码**:用于表示蛋白质的二级结构信息,将每个氨基酸残基转化为20维向量,反映了该位置氨基酸的保守程度。同时,DSSP被用来识别蛋白质的八种二级结构状态,并用八维one-hot向量表示。 4. **JET2features编码**:此编码不仅包含氨基酸的局部和全局几何信息,还使用二进制字节表示残基是否属于蛋白质界面,并通过循环方差(CV)来描述蛋白质表面和局部残基的几何形状。这为蛋白质的结构相互作用提供了丰富的信息。 5. **PSSM编码进化信息**:PSSM编码进一步补充了蛋白质的进化信息,这在预测性能中起到了重要作用。10折交叉验证是评估预测性能的常用方法,但在这里的具体结果没有给出。 通过集成这些特征,SGPPI能够在严谨条件下实现蛋白质-蛋白质相互作用的结构感知预测,这对于研究蛋白质网络、药物设计以及疾病机制的理解都有重大意义。这种方法的创新在于将深度学习与生物学信息学相结合,提高了预测的准确性和实用性。