SMILES transformer
时间: 2023-10-11 09:08:10 浏览: 100
SMILES transformer是一种基于Transformer模型的方法,用于将SMILES字符串进行规范化处理。该方法首先使用Transformer模型将给定的任意SMILES转换为规范化的SMILES表示。接下来,将转换后的SMILES作为输入,同时使用图形视图作为输入,通过GNN模块进行处理。最终,通过应用MLM损失函数对Transformer和GNN模块进行训练。根据论文中的实验结果,SMILES transformer在未知类型设置下达到了42.3%的最佳精度。
相关问题
smiles2vec
Smiles2Vec是一种用于分子表示的方法。在化学领域,分子可以使用SMILES(简化分子输入线形表示法)表示。而Smiles2Vec则将这些SMILES字符串转化为向量表示。
Smiles2Vec的工作原理是将SMILES字符串转换为分子图结构,然后将图结构转换为向量表示。具体来说,首先将SMILES字符串分解成一个个原子和键的序列,然后将这些原子和键构建成一个分子图。接下来,利用图嵌入算法对这个分子图进行特征提取,得到对应的向量表示。这个向量表示可以用于分子的相似性比较、属性预测等任务。
Smiles2Vec的优势在于它可以处理具有结构性的化学信息,并将其转化为可计算的向量表示。这种向量表示可以更方便地进行机器学习和深度学习等算法的应用。例如,可以通过计算两个分子的向量之间的距离来评估其相似性。此外,Smiles2Vec还可以用于分子属性的预测,比如溶解度、药效等。
总而言之,Smiles2Vec是一种将SMILES字符串转化为向量表示的方法,可以用于处理和分析化学分子的结构信息。它的应用领域覆盖了分子相似性比较、属性预测等多个方面,具有很高的实用价值。
smiles格式 枚举
SMILES(简写为Simplified Molecular Input Line Entry System)是一种用来描述化学结构的字符串格式,常用于计算机化学和化学信息学领域。
SMILES格式是由一系列字符组成的字符串,用于表示分子的结构和拓扑关系。它采用了语法规则和短字符表示来描述分子的原子、键和分子间连接。SMILES格式可以轻松地用计算机存储和传输,因此被广泛应用于化学信息学的相关领域。
SMILES格式的优势之一是简洁性。通过使用特殊的字符符号,可以用较少的字符来表示大量的化学信息。例如,原子可以用其化学符号表示,而不需要使用完整的名称。键的种类可以用单个字符表示。
SMILES格式还具有良好的可读性和一致性。由于采用了统一的规则和约定,不同的SMILES字符串可以被有效地比较和分析。这使得SMILES格式在化学数据库中的搜索和检索操作中非常有用。
除了描述分子的结构外,SMILES格式还可以表示化学反应。通过使用特殊的指定符号和语法规则,可以描述分子之间的化学转化和反应路径。
总之,SMILES格式是一种常用的化学结构字符串表示法,具有简洁性、可读性和一致性的优势。它在计算机化学和化学信息学领域广泛应用,并为化学数据库的搜索和分析提供了可靠和高效的工具。