Transformer-BiLSTM融合模型预测DNA结合蛋白新方法

需积分: 5 0 下载量 185 浏览量 更新于2024-08-03 收藏 1.17MB PDF 举报
"这篇论文由钟来民等人撰写,发表于《微电子学与计算机》2023年第40卷第12期,提出了基于Transformer-BiLSTM特征融合的DNA结合蛋白预测方法,旨在解决传统生物技术在预测DNA结合蛋白时效率低、成本高的问题。论文中介绍的深度学习框架结合了Transformer和双向平行长短期记忆神经网络,能够有效提取蛋白质序列和进化信息的特征,并在PDB2272数据集上表现出优于PDBP_Fusion模型的性能。" 本文关注的是生物信息学领域的一个重要议题——DNA结合蛋白的预测。DNA结合蛋白在生命活动中起着关键作用,因此对它们的研究对于理解生命过程和开发新的药物具有重大价值。然而,传统的实验方法在预测这类蛋白时存在效率低下和成本高昂的局限性。 钟来民等人提出的解决方案是利用深度学习,具体来说,他们构建了一个融合了Transformer和双向长短期记忆网络(BiLSTM)的模型。Transformer是一种先进的序列建模架构,尤其在自然语言处理任务中表现突出,而BiLSTM则擅长捕捉序列数据中的长期依赖关系。通过结合这两种模型,新模型能够从蛋白质序列中捕获更丰富的信息,同时利用进化信息来增强特征提取能力。 在实验部分,研究者使用了PDB2272数据集进行训练和测试,结果显示,该模型在精度(ACC)和Matthews相关系数(MCC)两项关键指标上,相比于PDBP_Fusion模型均有显著提升,分别为2.64%和5.51%,这表明新模型在预测DNA结合蛋白上的性能更为优越。 该工作不仅为蛋白质特征提取提供了新的视角,也为深度学习在生物信息学中的应用开辟了新的路径,特别是如何利用Transformer编码器块来获取蛋白质的全局特征。这些发现对于提高DNA结合蛋白的预测效率,以及加速相关领域的研究进程具有重要意义。文章的关键词包括Transformer、BiLSTM、DNA结合蛋白、特征提取和深度学习,反映了研究的核心内容和技术手段。