没有合适的资源?快使用搜索试试~ 我知道了~
首页RDKit Documentation Release 2019.09.1.pdf
RDKit Documentation Release 2019.09.1.pdf
需积分: 49 20 下载量 12 浏览量
更新于2023-03-03
评论 3
收藏 1.58MB PDF 举报
开源化学信息学工具包RDKit的手册。RDKit提供各种功能,如不同的化学I/O格式,包括SMILES/SMARTS,结构数据格式(SDF),Thor数据树(TDT),Sybyl线符号(SLN),mol2和蛋白质结构文件(PDB)。子结构搜索; 标准SMILES; 手性支持;化学转化;化学反应;分子序列化;相似性/多样性选择;二维药效团;三维维药效团;分层子图/片段分析; Bemis和Murcko骨架;逆合成组合分析及分子碎裂(RECAP); 多分子最大共同亚结构;功能图;基于形状的相似性;基于RMSD的分子比对;基于形状的对齐;使用Open3-DALIGN算法的无监督分子-分子比对;与PyMOL进行3D可视化集成;功能基团过滤;分子描述符库;相似图;机器学习等等
资源详情
资源评论
资源推荐
RDKit Documentation
Release 2019.09.1
Greg Landrum
May 13, 2019
Contents
1 An overview of the RDKit 1
1.1 What is it? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Open source toolkit for cheminformatics . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.2 Operational: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.3 History: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Integration with other open-source projects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Usage by other open-source projects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.4 The Contrib Directory . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.5 Footnotes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.6 License . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
2 Installation 5
2.1 Cross-platform under anaconda python (fastest install) . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.1 Introduction to anaconda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.2 How to get conda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.3 How to install RDKit with Conda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.3.1 conda-forge package . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.4 How to build from source with Conda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.4.1 macOS 10.12 (Sierra): Python 3 environment . . . . . . . . . . . . . . . . . . . . 6
2.1.4.2 Linux x86_64: Python 3 environment . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.5 Installing and using PostgreSQL and the RDKit PostgreSQL cartridge from a conda environ-
ment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Linux and OS X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1 Installation from repositories . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1.1 Ubuntu 12.04 and later . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1.2 Fedora, CentOS, and RHEL . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1.3 OS X . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.2 Building from Source . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.2.1 Installing prerequisites from source . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.2.2 Building the RDKit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.2.3 Testing the build (optional, but recommended) . . . . . . . . . . . . . . . . . . . . 10
2.2.2.4 Advanced . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.2.5 Frequently Encountered Problems . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.3 Windows . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3.1 Prerequisites . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
2.3.1.1 Recommended extras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
i
2.3.2 Installation of RDKit binaries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3.3 Installation from source . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3.3.1 Extra software to install . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3.3.2 Setup and Preparation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3.3.3 Building from the command line (recommended) . . . . . . . . . . . . . . . . . . 15
2.3.3.4 Testing the Build (optional, but recommended) . . . . . . . . . . . . . . . . . . . . 15
2.4 License . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
3 Getting Started with the RDKit in Python 17
3.1 Important note . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.2 What is this? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.3 Reading and Writing Molecules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.3.1 Reading single molecules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
3.3.2 Reading sets of molecules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
3.3.3 Writing molecules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.3.4 Writing sets of molecules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.4 Working with Molecules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.4.1 Looping over Atoms and Bonds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.4.2 Ring Information . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
3.4.3 Modifying molecules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.4.4 Working with 2D molecules: Generating Depictions . . . . . . . . . . . . . . . . . . . . . . 25
3.4.5 Working with 3D Molecules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
3.4.6 Preserving Molecules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.4.7 Drawing Molecules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.5 Substructure Searching . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.5.1 Stereochemistry in substructure matches . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.5.2 Atom Map Indices in SMARTS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.6 Chemical Transformations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
3.6.1 Substructure-based transformations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.6.2 Murcko Decomposition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.7 Maximum Common Substructure . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.8 Fingerprinting and Molecular Similarity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.8.1 Topological Fingerprints . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.8.2 MACCS Keys . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.8.3 Atom Pairs and Topological Torsions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.8.4 Morgan Fingerprints (Circular Fingerprints) . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.8.4.1 Explaining bits from Morgan Fingerprints . . . . . . . . . . . . . . . . . . . . . . 40
3.8.5 Generating images of fingerprint bits . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.8.6 Picking Diverse Molecules Using Fingerprints . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.8.7 Generating Similarity Maps Using Fingerprints . . . . . . . . . . . . . . . . . . . . . . . . 43
3.9 Descriptor Calculation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.9.1 Visualization of Descriptors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.10 Chemical Reactions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.10.1 Advanced Reaction Functionality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.10.1.1 Protecting Atoms . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.10.2 Recap Implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.10.3 BRICS Implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.10.4 Other fragmentation approaches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.11 Chemical Features and Pharmacophores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.11.1 Chemical Features . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.11.2 2D Pharmacophore Fingerprints . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.12 Molecular Fragments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.13 Non-Chemical Functionality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.13.1 Bit vectors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
ii
3.13.2 Discrete value vectors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.13.3 3D grids . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.13.4 Points . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.14 Getting Help . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.15 Advanced Topics/Warnings . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.15.1 Editing Molecules . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.16 Miscellaneous Tips and Hints . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.16.1 Chem vs AllChem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.16.2 The SSSR Problem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.17 List of Available Descriptors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.18 List of Available 3D Descriptors . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.19 List of Available Fingerprints . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.20 Feature Definitions Used in the Morgan Fingerprints . . . . . . . . . . . . . . . . . . . . . . . . . . 66
3.21 License . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4 The RDKit Book 69
4.1 Misc Cheminformatics Topics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.1.1 Aromaticity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.1.1.1 The RDKit Aromaticity Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
4.1.1.2 The Simple Aromaticity Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.1.3 The MDL Aromaticity Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.2 SMILES Support and Extensions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.2.1 Aromaticity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.2.2 Dative bonds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
4.1.2.3 Specifying atoms by atomic number . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.1.2.4 CXSMILES extensions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.1.3 SMARTS Support and Extensions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
4.1.3.1 Hybridization queries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.1.3.2 Dative bonds . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.1.3.3 Heteroatom neighbor queries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.1.3.4 Range queries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.1.4 Ring Finding and SSSR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.2 Chemical Reaction Handling . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.2.1 Reaction SMARTS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.2.1.1 Some features . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
4.2.1.2 Chirality . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
4.2.1.3 Rules and caveats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.3 The Feature Definition File Format . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.3.1 Chemical Features . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.3.2 Syntax of the FDef file . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.3.2.1 AtomType definitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
4.3.2.2 Feature definitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.3.2.3 Additional syntax notes: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.3.2.4 Atom weights and feature locations . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.3.3 Frequently Asked Question(s) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.4 Representation of Pharmacophore Fingerprints . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.5 Atom-Atom Matching in Substructure Queries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.6 Molecular Sanitization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.7 Implementation Details . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.7.1 “Magic” Property Values . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.7.1.1 ROMol (Mol in Python) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.7.1.2 Atom . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.7.2 Thread safety and the RDKit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
4.7.2.1 What has been tested . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
iii
剩余158页未读,继续阅读
DrugAI
- 粉丝: 3628
- 资源: 7
上传资源 快速赚钱
- 我的内容管理 收起
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
会员权益专享
最新资源
- c++校园超市商品信息管理系统课程设计说明书(含源代码) (2).pdf
- 建筑供配电系统相关课件.pptx
- 企业管理规章制度及管理模式.doc
- vb打开摄像头.doc
- 云计算-可信计算中认证协议改进方案.pdf
- [详细完整版]单片机编程4.ppt
- c语言常用算法.pdf
- c++经典程序代码大全.pdf
- 单片机数字时钟资料.doc
- 11项目管理前沿1.0.pptx
- 基于ssm的“魅力”繁峙宣传网站的设计与实现论文.doc
- 智慧交通综合解决方案.pptx
- 建筑防潮设计-PowerPointPresentati.pptx
- SPC统计过程控制程序.pptx
- SPC统计方法基础知识.pptx
- MW全能培训汽轮机调节保安系统PPT教学课件.pptx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0