蛋白质结构预测方法综述:从序列到空间结构

需积分: 33 46 下载量 34 浏览量 更新于2024-08-08 收藏 6.26MB PDF 举报
"蛋白质结构预测方法-i.mx_virtualization_user's_guide" 这篇文章详细介绍了在生物信息学领域中,如何通过科学方法和技术手段预测蛋白质的空间结构。蛋白质结构预测是生物学研究中的关键环节,尤其对于那些难以通过实验手段如核磁共振和X光晶体衍射测定结构的蛋白质。文章指出,尽管实验测定具有挑战性,但基于一级序列推断空间结构的重要性不容忽视,因为理论上,蛋白质的一级结构决定了其空间构象。 蛋白质结构预测主要依靠两种方法:同源性方法和从头计算方法。同源性方法是基于两个蛋白质序列相似性高的假设,如果两个蛋白质的氨基酸序列相似度达到75%以上,就可以推测它们的结构相近。这种方法准确度较高,但限制在于仅适用于与已知模板库中序列相似的情况。从头计算方法则试图从物理热力学原理出发,寻找蛋白质能量最小的状态,理论上是影响蛋白质结构的关键因素,但由于计算复杂度极高,目前只能处理少数氨基酸结构的预测,IBM的Blue Gene超级计算机被用于这类计算密集型任务。 此外,文章还涉及了生物信息学实用技术中的软件工具,如Unix/Linux操作系统的基础操作,数据处理工具如测序原理、峰图转化、序列比对(如Clustalw、MUSCLE、Blast等)、基因组注释(包括重复序列分析、RNA分析、基因预测和功能注释)、SNP分析(如Polyphred、SNPdetector和cross_match)以及进化分析工具(如Phylip和Paml)。这些软件是生物信息学家和研究人员进行大规模数据分析、基因功能研究和进化关系研究的重要工具。 这篇文章深入探讨了蛋白质结构预测的理论基础和实践应用,以及一系列生物信息学软件在其中的运用,为生物科学研究提供了强有力的技术支持。对于生物信息学专业人士和对蛋白质结构感兴趣的读者来说,这是理解和掌握该领域核心知识的重要参考资料。