PDB文件格式详解:生物大分子三维结构档案
需积分: 19 94 浏览量
更新于2024-09-10
收藏 19KB TXT 举报
"PDB后缀文件格式是用于存储生物大分子如蛋白质、核酸和氨基酸三维结构的重要格式,由蛋白质数据库(PDB)维护。这种格式包含原子坐标、晶体学信息、NMR数据以及有关分子结构的详细元数据,服务于科研、教育领域。PDB文件仅使用非控制ASCII字符,避免特殊字符,而希腊字母则以英文拼写表示。文件中的等号、逗号、冒号和分号有特定用途,需注意转义规则。"
PDB文件格式详解:
PDB(Protein Data Bank)文件格式是国际通用的标准格式,用于存储通过实验方法(如X射线晶体学、核磁共振和电子显微镜)获得的生物大分子的三维结构信息。这种格式被广泛应用于生物学、药物研发和计算化学等领域,便于研究人员分析和比较不同分子的结构。
1. 文件内容:
- 原子坐标:详细记录每个原子的位置,包括原子名称、元素符号、坐标值(x, y, z)以及相关属性,如原子的温度因子(表示运动性)和电荷。
- 结构因素:在晶体学研究中,记录了晶体衍射数据,用于推断原子坐标。
- NMR数据:包含核磁共振谱的参数,用于确定溶液中分子的动态结构。
- 其他信息:分子名称、主次结构(如α螺旋、β折叠)、序列数据库参考、配体信息(如与蛋白质结合的小分子)、生物组装(如蛋白质复合物的结构)以及结构解析和数据收集的详细步骤。
2. 字符集与编码:
PDB文件使用非控制ASCII字符,包括字母、数字和特定标点符号。希腊字母用英文拼写表示(如alpha, beta, gamma)。行尾可以是回车换行或单独的换行符,具体取决于操作系统。特别字符如着重号(DOT)和箭头(->, <-)有特定含义。
3. 分隔符与转义:
- 等号“=”通常用于表示数学等式,周围应有空格包围。
- 逗号、冒号和分号用于分隔列表项,但在特定上下文中,如在记录类型如COMPND中,它们有特殊用途,若作为普通字符使用需进行转义,前加反斜杠“\”。
4. 记录类型:
PDB文件由不同类型的记录组成,如ATOM(原子坐标)、HETATM(非标准残基的原子坐标)、HEADER(文件头部信息)、CONECT(原子间连接性)、COMPND(化合物信息)等。每条记录以特定的四个字母标识,随后是记录的具体内容。
例如,COMPND记录用于描述分子信息,包括分子名称、链信息、同义词、酶代码(EC号)以及是否为工程改造蛋白。在给出的示例中,可以看到多个COMPND记录,每个记录用分号分隔,表示不同的分子或亚单位信息。
总结,PDB文件格式是生物大分子结构研究的核心,它以简洁的方式存储丰富的结构信息,便于科学家们理解和利用这些结构进行进一步的研究。了解并熟练掌握PDB格式对于解析、分析和利用生物分子结构至关重要。
2021-06-01 上传
2023-09-08 上传
2023-07-13 上传
2023-10-26 上传
2024-05-09 上传
2023-06-09 上传
2023-03-16 上传
jianchiyiye
- 粉丝: 2
- 资源: 2
最新资源
- JDK 17 Linux版本压缩包解压与安装指南
- C++/Qt飞行模拟器教员控制台系统源码发布
- TensorFlow深度学习实践:CNN在MNIST数据集上的应用
- 鸿蒙驱动HCIA资料整理-培训教材与开发者指南
- 凯撒Java版SaaS OA协同办公软件v2.0特性解析
- AutoCAD二次开发中文指南下载 - C#编程深入解析
- C语言冒泡排序算法实现详解
- Pointofix截屏:轻松实现高效截图体验
- Matlab实现SVM数据分类与预测教程
- 基于JSP+SQL的网站流量统计管理系统设计与实现
- C语言实现删除字符中重复项的方法与技巧
- e-sqlcipher.dll动态链接库的作用与应用
- 浙江工业大学自考网站开发与继续教育官网模板设计
- STM32 103C8T6 OLED 显示程序实现指南
- 高效压缩技术:删除重复字符压缩包
- JSP+SQL智能交通管理系统:违章处理与交通效率提升