PDB文件格式详解:生物大分子三维结构档案

需积分: 19 3 下载量 116 浏览量 更新于2024-09-10 收藏 19KB TXT 举报
"PDB后缀文件格式是用于存储生物大分子如蛋白质、核酸和氨基酸三维结构的重要格式,由蛋白质数据库(PDB)维护。这种格式包含原子坐标、晶体学信息、NMR数据以及有关分子结构的详细元数据,服务于科研、教育领域。PDB文件仅使用非控制ASCII字符,避免特殊字符,而希腊字母则以英文拼写表示。文件中的等号、逗号、冒号和分号有特定用途,需注意转义规则。" PDB文件格式详解: PDB(Protein Data Bank)文件格式是国际通用的标准格式,用于存储通过实验方法(如X射线晶体学、核磁共振和电子显微镜)获得的生物大分子的三维结构信息。这种格式被广泛应用于生物学、药物研发和计算化学等领域,便于研究人员分析和比较不同分子的结构。 1. 文件内容: - 原子坐标:详细记录每个原子的位置,包括原子名称、元素符号、坐标值(x, y, z)以及相关属性,如原子的温度因子(表示运动性)和电荷。 - 结构因素:在晶体学研究中,记录了晶体衍射数据,用于推断原子坐标。 - NMR数据:包含核磁共振谱的参数,用于确定溶液中分子的动态结构。 - 其他信息:分子名称、主次结构(如α螺旋、β折叠)、序列数据库参考、配体信息(如与蛋白质结合的小分子)、生物组装(如蛋白质复合物的结构)以及结构解析和数据收集的详细步骤。 2. 字符集与编码: PDB文件使用非控制ASCII字符,包括字母、数字和特定标点符号。希腊字母用英文拼写表示(如alpha, beta, gamma)。行尾可以是回车换行或单独的换行符,具体取决于操作系统。特别字符如着重号(DOT)和箭头(->, <-)有特定含义。 3. 分隔符与转义: - 等号“=”通常用于表示数学等式,周围应有空格包围。 - 逗号、冒号和分号用于分隔列表项,但在特定上下文中,如在记录类型如COMPND中,它们有特殊用途,若作为普通字符使用需进行转义,前加反斜杠“\”。 4. 记录类型: PDB文件由不同类型的记录组成,如ATOM(原子坐标)、HETATM(非标准残基的原子坐标)、HEADER(文件头部信息)、CONECT(原子间连接性)、COMPND(化合物信息)等。每条记录以特定的四个字母标识,随后是记录的具体内容。 例如,COMPND记录用于描述分子信息,包括分子名称、链信息、同义词、酶代码(EC号)以及是否为工程改造蛋白。在给出的示例中,可以看到多个COMPND记录,每个记录用分号分隔,表示不同的分子或亚单位信息。 总结,PDB文件格式是生物大分子结构研究的核心,它以简洁的方式存储丰富的结构信息,便于科学家们理解和利用这些结构进行进一步的研究。了解并熟练掌握PDB格式对于解析、分析和利用生物分子结构至关重要。