Python生物信息学:读写晶体结构文件-PDB解析
需积分: 35 95 浏览量
更新于2024-08-09
收藏 3.68MB PDF 举报
"这篇文档是关于使用BioPython库读取和操作晶体结构文件,特别是PDB格式的文件。文中详细介绍了如何使用PDBParser类来解析PDB文件,并获取其中的结构信息。此外,还提到了PDB文件的header部分以及如何通过Structure对象访问这些信息。"
在晶体结构分析中,BioPython是一个非常重要的工具,它提供了处理生物学数据的强大功能,特别是对于蛋白质结构数据。在标题提到的"晶体结构文件的读与写"这一主题中,我们关注的是如何利用BioPython处理PDB(蛋白质数据银行)文件。PDB文件是存储蛋白质、核酸和其他大分子三维结构的标准格式。
11.1.1部分详细讲解了如何读取PDB文件。首先,需要导入`Bio.PDB.PDBParser`模块,并创建一个`PDBParser`对象,可以设置`PERMISSIVE`参数来忽略PDB文件中的一些问题。然后,通过调用`get_structure`方法,传入结构ID和文件名,即可得到一个`Structure`对象。这个对象包含了PDB文件中的所有结构信息。
PDBParser的`get_header`和`get_trailer`方法可以用来提取PDB文件的头部和尾部信息,但通常头部信息可能不完整或存在错误。因此,如果需要更准确的数据,建议使用mmCIF格式,因为它提供了更详尽且校正过的信息。
在结构对象中,`header`属性是一个字典,包含了PDB文件头部的记录和它们对应的值。例如,可以从中获取分辨率(resolution)和关键词(keywords)等关键信息。字典中还有其他键,如name、head、deposition_date、release_date、structure_method、resolution、structure_reference、journal_reference、author和compound,这些键分别对应着结构的名称、标题、提交日期、发布日期、结构测定方法、分辨率、结构相关的参考文献、作者信息以及结晶化合物的详细数据。
这篇文档出自Biopython的中文教程,由多个贡献者共同翻译和校对,旨在帮助生物信息学研究者更好地理解和使用Biopython库。教程覆盖了从基础的安装到高级的使用案例,为用户提供了一个全面了解和掌握BioPython的资源。如果你在使用过程中遇到任何问题,可以在提供的GitHub项目主页上提交错误信息或进行修正,也可以加入相关的QQ群进行交流和讨论。
2014-07-20 上传
2015-09-30 上传
2021-04-29 上传
2021-05-02 上传
2021-02-22 上传
2021-03-23 上传
2021-03-05 上传
2021-03-16 上传
2021-03-24 上传
龚伟(William)
- 粉丝: 32
- 资源: 3901
最新资源
- MATLAB新功能:Multi-frame ViewRGB制作彩色图阴影
- XKCD Substitutions 3-crx插件:创新的网页文字替换工具
- Python实现8位等离子效果开源项目plasma.py解读
- 维护商店移动应用:基于PhoneGap的移动API应用
- Laravel-Admin的Redis Manager扩展使用教程
- Jekyll代理主题使用指南及文件结构解析
- cPanel中PHP多版本插件的安装与配置指南
- 深入探讨React和Typescript在Alias kopio游戏中的应用
- node.js OSC服务器实现:Gibber消息转换技术解析
- 体验最新升级版的mdbootstrap pro 6.1.0组件库
- 超市盘点过机系统实现与delphi应用
- Boogle: 探索 Python 编程的 Boggle 仿制品
- C++实现的Physics2D简易2D物理模拟
- 傅里叶级数在分数阶微分积分计算中的应用与实现
- Windows Phone与PhoneGap应用隔离存储文件访问方法
- iso8601-interval-recurrence:掌握ISO8601日期范围与重复间隔检查