没有合适的资源?快使用搜索试试~ 我知道了~
生命科学中的人工智能1(2021)100015方法用于复合优化的Atsushi Yoshimoria,Jürgen Bajorathb,理论医学研究所,251 -0012神奈川县藤泽市村冈东2丁目b生命科学信息学和数据科学系,B-IT,LIMES程序单元化学生物学和药物化学,Rheinische Friedrich-Wilhelms-Universität,Friedrich-Hirzebruch-Allee 5/6,D-53115 Bonn,GermanyaRT i cL e i nf o保留字:构效关系分子设计SAR矩阵X深度学习复合优化a b sTR a cT结构-活性关系(SAR)矩阵(SARM)方法系统地从任何来源提取结构相关的化合物系列,并将这些系列组织在由类似于药物化学中的R-基团表的矩阵形成的独特数据结构中。此外,SARM方法生成虚拟类似物的结构组织的系列,包括现有的核心结构和R-基团的新组合。对于活性化合物,SARM可视化SAR模式并有助于化合物设计。SARM方法和数据结构与递归神经网络架构相集成,以进一步扩展深度生成模型的复合设计能力,从而形成DeepSARM方法。在本文中,我们提出了一种用于化合物优化的DeepSARM框架的扩展,称为迭代DeepSARM( iDeepSARM ) , 它 涉 及 深 度 生 成 建 模 和 微 调 的 多 次 迭 代 , 以 获 得 越 来 越 可 能 的 活 性 化 合 物 。 因 此 ,iDeepSARM为DeepSARM框架增加了计算命中领先和领先优化功能。除了详细介绍方法学特征和计算协议外,还报告了示例性化合物设计应用程序以说明iDeepSARM方法。1. 介绍用于结构-活性关系(SAR)的系统分析和可视化的计算方法在药物化学中具有很高的兴趣[1同样相关的是为复合(命中-领先和领先)优化提供计算决策支持的方法[6后一种方法大多采用统计数据分析,识别优化过程中产生的关键化合物,和/或监测SAR进展。然而,这些方法通常不建议用于合成的新化合物。这同样适用于SAR可视化方法,这些方法本质上主要是描述性的。据我们所知,目前只有一种方法可以将活性化合物之间的结构关系的系统评估与SAR可视化和前瞻性化合物设计相结合,即,SAR矩阵(SARM)方法[11]。SARM分析通过系统地比较相关类似物系列(AS)中的核心结构和取代基,并在这些系列中识别未探索的核心-取代基组合,提出了新的类似物。SARM的复合设计组件已通过深度生成建模进行了扩展,从而产生了DeepSARM[12],其利用来自选定目标和相关复合数据集的额外信息来进一步扩展设计空间。*通讯作者:德国波恩大学电子邮件地址:bajorath@bit.uni-bonn.de(J. Bajorath)。https://doi.org/10.1016/j.ailsci.2021.100015在这里,我们报告了DeepSARM的迭代复合优化扩展。在下文中,我们 首 先 介 绍 SARM/DeepSARM 框 架 , 然 后 详 细 介 绍 迭 代 DeepSARM(iDeepSARM)方法。提出了一个示例性的化合物设计应用程序,以说明iDeepSARM的方法特征及其设计能力。2. 方法框架2.1. SAR矩阵概念SARM最初被设计为从大型化合物集合中系统地提取AS,将结构相关的AS组织在令人联想到R组表的矩阵中,可视化SAR,并生成虚拟候选化合物以进一步扩展AS。通过双步骤化合物分解方案[11]促进结构相关AS的识别和组织,类似于生成匹配分子对(MMP)的键断裂[13]。在第一步中,化合物中的环外单键被系统地裂解,对所得片段施加大小限制,从而产生存储在索引表中的键(核心结构,骨架)和值(取代基,R基团)。该程序识别所有共享特定核心的类似物,在单个位点具有R基团取代,因此为每个结构独特的核心定义匹配分子系列(MMS)[5]接收日期:2021年10月20日;接收日期:2021年11月14日;接受日期:2021年11月16日2021年11月20日网上发售2667-3185/© 2021作者。由Elsevier B. V.发布。这是一个CC BY-NC-ND许可证下的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)可在ScienceDirect上获得目录列表生命科学期刊首页:www.elsevier.com/locate/ailsciA. Yoshimori和J. 巴约拉特生命科学中的人工智能1(2021)1000152Fig. 1. 使用DeepSARM生成SAR矩阵。(A)SARM数据结构的设计使用三个小的结构相关的复合系列(A、B和C)来说明。来自不同系列的类似物被连续编号,并且它们的pKi值以红色报告。不同的取代基显示在蓝色背景和表示标记(键)的子结构被着色为红色。在SARM中,每一行包含一个MMS,每一列包含来自不同系列的具有相同取代基(值)的化合物。EX类似物由通过活性进行颜色编码的细胞表示。此外,空单元格表示虚拟的类似物。此图取自[15]。(B)说明了DeepSARM的架构,它由三个LSTM编码器-解码器单元组成。的 ”[12]这句话的意思是:(C)使用Seq2Seq模型为值2和值1说明了具有DeepSARM的SARM的构建。钥匙2是一个sca-100,其表示用于生成值2的Seq2Seq模型的输入,键2的R2取代基sca_old。键1由键2和值2构成。关键1是Seq2Seq模型对于值1的输入,键1或键2的R1取代基。SARM是从得到的键1和值1片段构建的,并通过对数似然分数进行颜色编码。值1和值2过滤器代表结构筛选,以去除化学上可疑的取代基(化学上不需要的子结构的内部收集的SMARTS模式)。在第二步中,将第一轮中获得的所有密钥重新提交给碎片化,然后识别出在单个位点发生化学变化的所有结构类似的核心和相应的MMS。 具有独特结构相关核的MMS的每个子集被组织在单独的SARM中,使得每行包含MMS,并且来自共享相同R基团的不同系列的每个列化合物,如图1A所示。根据给定化合物集合中包含的AS及其结构关系,获得不同数量的SARM。SARM中的每个细胞代表一种独特的化合物。SAR信息通过根据化合物效力对细胞着色来可视化。因此,可以在SARM内追踪结构关系和相关活动模式。空单元表示由不存在的键-值(核心-取代基)组合组成的虚拟类似物,也如图1A所示。因此,来自SARM的虚拟候选化合物进一步扩展了相关AS的化学空间,并且可以设想在这些系列周围的化学空间中形成包络。SARM方法和由此产生的SARM数据结构是SAR可视化和复合设计之间的桥梁。通过整合活性预测方法[14]和提供一致性的分子网格图,该跨化合物数据集的不同SARM组织的现有和虚拟化合物的SUS视图[15]。SARM分析和对虚拟候选物的选择已经导致了针对不同靶标的新活性化合物的鉴定[162.2. 深度学习扩展DeepSARM基于进一步扩展类似物设计的想法,通过考虑与主要目标相关的不同靶标的活性化合物的信息[12]。例如,DeepSARM模型最初可以用对感兴趣的靶标所属的靶标家族具有活性的化合物进行训练,然后对主要靶标的模型进行微调。该程序增加了SARM方法的近距离模拟设计能力。然后可以用新的关键和值片段进一步扩展由原始两步片段化产生的SARM,并且可以获得完全由新片段和化合物组成的额外的SARM。对于基于编码为规范SMILES字符串的键和值片段的生成设计[19],编码器-解码器框架-A. Yoshimori和J. 巴约拉特生命科学中的人工智能1(2021)1000153Fig. 1. 继续由长短期记忆(LSTM)单元组成的工作[20]代表了首选的递归神经网络(RNN)架构[21]。 编码器-解码器框架用于导出序列到序列(Seq2Seq)模型,该模型将一个独热编码SMILES字符串的序列转换为另一个[22]。编码器LSTM将输入序列转换为潜在空间中的两个状态向量,解码器LSTM经过训练以返回与转换后的SMILES相同的序列。对于Deep-SARM,使用keras[23](具有256维潜在LSTM编码空间)构建编码器-解码器单元。DeepSARM包括三个编码器-解码器单元,用于生成Seq 2Seq模型,如图所示。 1B. 关键字的Seq2Seq模型2(即,密钥2生成器)使用输入密钥2 /输出密钥2对、使用密钥2 /值2对的值2的模型以及使用密钥1 /值1对的值1的模型来训练。将具有新生成的密钥片段的化合物添加到包含结构类似密钥(满足步骤2片段化标准)的原始SARM中,从而进一步扩展SARM。三个Seq2Seq模型推导如下:(I) 使用键2(输入)/键2(目标)对的模型(键2);(II) 使用键2(输入)/值2(目标)对的模型(值2)(III) 使用键1(输入)/值1(目标)对模型(值1)A. Yoshimori和J. 巴约拉特生命科学中的人工智能1(2021)1000154(|)图二.迭代DeepSARM的组件。iDeepSARM方法的三个组成部分(步骤)包括预训练,微调和迭代微调,如文中所述使用大量对靶家族具有活性的化合物进行预训练,并使用对主要靶具有活性的非常小的一组化合物进行微调。在微调期间,调整内部模型权重。Seq2Seq模型生成基于对数似然分数评估的键2、值2和值1���log ������������������−������������������������= −������������������������−1,���=1P表示解码器的概率分布,T表示给定片段的SMILES令牌的数量。负号确保高概率导致片段优先化的小分数。 对数似然阈值可以应用于滤波器片段。然后通过组合新生成的键1和值1片段来获得复合物。提供了进一步的DeepSARM计算细节在[12]中。图图1C示出了对于值2和值1使用Seq2Seq模型来生成SARM。关键2片段为Seq2Seq模型提供输入,生成值2片段。然后,从键2和值2片段构造键1得到的关键1片段用作值为1的Seq2Seq模型的输入。然后通过组合所得的键1和值1片段来获得包含SARM的新化合物。SARM的每个单元格代表一种新化合物,并通过组合对数似然评分进行颜色编码无效的SMILES字符串被删除,值1和值2过滤器是SMARTS筛选,用于删除化学上不需要的取代基(如不稳定的片段)。3. 迭代DeepSARM3.1. 方法概念和工作流程iDeepSARM方法旨在优化新鉴定的活性化合物。它由三个组件(步骤)组成,包括预训练,微调和迭代微调,如图2所示。在化合物的SARM片段化之后,使用键1 /值1和键2 /值2对来训练Seq 2Seq模型(值1)和Seq2Seq模型(值2)。迭代微调侧重于DeepSARM的关键2个片段(sca_bolds)。 每一个sca标签代表一个MMS。值1和值2片段作为两个不同取代位点的R基团。新产生的价值1和2片段被过滤用于结构警报(化学上不需要的子结构的内部集合的SMARTS),并且接受的片段被用于构建每个键2具有预定义维度的SARM变体。该SARM变体由值1/值组成2种组合,其中对应的化合物(键2 /值1/值2组合)被枚举并经受预处理的使用分子地形图(MTM)方法[24]进行检测,进一步描述如下。结构精英选择集中于具有n个排名靠前的预测活性的化合物,然后将其进行重新片段化并选择与关键2片段(sca_bold)相关的关键1 /值1和关键2 /值2对。新生成的键1 /值然后,键1和键2 /值2对被用作下一个微调周期的输入数据。对于初始迭代,Seq2Seq模型权重从DeepSARM微调转移。在迭代微调期间,模型权重在每个周期之后更新迭代是在-A. Yoshimori和J. 巴约拉特生命科学中的人工智能1(2021)1000155图三.使用iDeepSARM进行复合优化。说明了使用iDeepSARM对关键的含2化合物的优化。(A)示出了进行优化的BRD4抑制剂JQ1及其关键词2的结构。(B)显示了用DeepSARM生成的含有JQ1关键2的化合物的SARM,表示优化的起始点(迭代i= 0)。SARM由30个值1(R1)和30个值2(R2)片段组成,产生900个化合物。通过预测化合物活性(pIC50)或值1 /值2组合的对数似然评分对其进行颜色编码。(C)SARM用迭代微调期间获得的新值1和2片段更新。显示了五次迭代(i=1,2,3,6,10)的结果,并通过化合物活性进行颜色编码。(D)The五个迭代更新的SARM通过对数似然分数进行颜色编码。示出了来自(B)中的SARM的(E)值2和(F)值1结构(以可能性的升序示出了对于i= 10来自SARM的(G)值2和(H)值1结构见图4。迭代化合物活性预测。在迭代优化期间,图3中报告了SARM的平均预测化合物误差条表示标准偏差。直到达到预定义的活动阈值或迭代次数。迭代微调的成功本质上取决于化合物活性预测和对数似然分数的可靠性。优选地,在优化程序期间应观察活性进展和对数似然估计的3.2. 活动预测对于iDeepSARM,采用了一种新的基于图像的活动预测方法,即MTM[24]。该方法总结见补充图S1A。其基本思想是使用复合物的特征集来生成生成地形图(GTM)模型[25]它将特征投影到二维矩阵X上并产生图像表示。GTM模型使用ugtm的runGTM函数计算[26]。然后,卷积神经网络(CNN)[27]MTM CNN的架 构 如 补 充 图 S1B 所 示 。 Conv2D_1 和 Conv2D_2 是 卷 积 层 以 及MaxPooling2D_1和MaxPooling2D_2池化层。在Dropout层中,随机选择的神经元在训练过程中被忽略在Flatten层中,矩阵X被转换为A. Yoshimori和J. 巴约拉特生命科学中的人工智能1(2021)1000156图五.配体-靶相互作用。(A)化合物JQ1与其MTM及其与BRD 4的复合物(PDB ID:3MXF)的X射线结构一起显示。报告了JQ1的基于MTM的活性预测(实验IC50值:77 nM)。(B)显示了来自iDeepSARM的预测具有更高活性的计算候选化合物(Comp001)的对接模型的相应表示。在复合物中,配体的碳原子和BRD 4的选定结合位点残基分别被着色为绿色和青色(否则,使用标准原子着色BRD 4的其余部分被描绘为带状表示。变成一个数组Dense_1和_2表示完全连接的层。CNN结构是使用keras实现的[23]。MTM方法的一个有吸引力的特征是能够可视化测试化合物的特征集(差异)相似性以补充活性预测。然而,将MTM用于iDeepSARM的主要动机是数据增强,当只有小的复合集可用于微调时,这是必需的。对于图像,可以使用一种稳健的数据增强方法,该方法基于连续值的混合系数[28]从图像对生成混合图像,这也可以精确计算相关的假设活动值。对于以下报告的计算,使用与生成键直径为4的扩展连接性指纹(ECFP 4)[29]相似的算法[24]计算原子特征集。对于runGTM,使用以下参数:k= 28,m= 2; k是GTM节点数量的平方根,m是径向基函数中心数量的平方根。对于其他参数,使用默认设置。在建立GTM模型后,利用ugtm的变换函数计算原子特征的响应度,并根据响应度之和生成MTM。4. 示例性化合物设计和优化4.1. 设计策略为了说明iDeepSARM建模,尝试对推定的多靶化合物进行优化。该应用程序的灵感来自最近的一项研究[30],其中DeepSARM用于鉴定PLK1激酶和含溴结构域的双靶点抑制剂的候选物。蛋白4(BRD4),一种作为表观遗传调节剂发挥作用的染色质相关蛋白[31] 。 PLK1 和 BRD4 都 是 癌 症 靶 点 。 在 这 个 化 合 物 设 计 实 验 中 ,DeepSARM使用对PLK 1或BRD 4具有活性的化合物进行预训练,并使用PLK 1/BRD 4双靶点抑制剂进行微调[30]。在这里,我们通过使用人类激酶组的抑制剂进行预训练,然后使用BRD4抑制剂进行微调并对BRD4抑制活性进行iDeepSARM优化来修改设计方案。因此,预期生成的候选化合物具有成为多激酶和BRD4抑制剂的潜力,并针对BRD4进行了优化。虽然我们目前没有选择实验测试首选候选人,但该设计非常适合说明计算iDeepSARM方法。4.2. 化合物数据和计算参数从ChEMBL的激酶SARFari集合[32]中,选择45,441种具有可靠活性测量的独特人激酶抑制剂用于预训练(图2中的步骤1)。此外,从ChEMBL(ID:1,163,125)中提取了2280种独特的BRD4抑制剂。对于初始微调,选择了1311种pIC50≥ 6的BRD4抑制剂(图2中的步骤2)。为了推导MTM CNN活性预测模型,使用了所有2280种抑制剂。为了训练iDeepSARM64.密钥1 /值1和密钥2 /值2对分别被分成训练集和验证集(9:1)。对于迭代微调,值1和值2生成的温度因子设置为1.0。在10次迭代中进行微调。对于每次迭代,选择具有最高预测活性的100种计算化合物作为输入。为A. Yoshimori和J. 巴约拉特生命科学中的人工智能1(2021)1000157见图6。 生成新的关键2结构。(A)示出了在数据增强的帮助下通过iDeepSARM生成新的密钥2结构的协议。(B)在顶部,示出了原始和示例性预测新密钥2。被取代的环部分是红色的。在底部,包含含有原始(左)和新关键2(右)的化合物的SARM具有恒定值1和2片段,根据图1B通过预测的活性进行颜色编码。 3 C.生成了一个特定密钥2,一个值1X值2的SARM变体,矩阵X维数为30 x30为了推导MTM CNN模型,将化合物/MTM数据集分为训练集、验证集和测试集(8:1:1)。模型在补充图S1B中示出。使用optuna超参数优化软件框架[33]确定模型的超参数(参见补充图1的图例)。补充图S2A和S2B分别显示了训练集和测试集的预测和实验pIC50值之间的相关性。结果表明,MTM CNN模型具有合理的准确性,对于测试集,只有有限数量的预测误差大于一个数量级。4.3. 迭代优化在图3A中,示出了称为JQ 1的已知BRD 4抑制剂及其关键2片段,该关键2片段含有两个取代位点,R1和R2,分别用于值1和值2片段。对于JQ1,值为1,使用DeepSARM预测2。图3B示出了通过预测的化合物活性(左)或来自Seq2Seq模型的组合对数似然评分进行颜色编码的所得(值1X可以看出,最初生成的JQ1类似物具有显著变化的预测活性,并且对数似然评分的分布以相对较低的值为主。在这些输入数据的基础上,iDeepSARM优化进行了10次迭代。图3C和3D显示了五次迭代的相应SARM表示,通过预测的化合物活性和对数进行颜色编码。可能性得分,分别。SARM显示出明显的平行进展,即化合物活性增加以及对数似然降低,因此表明化合物优化成功。补充图S3A和S3B分别示出了来自初始SARM(i= 0)的值2和值1片段,初始SARM(i = 0)是优化的起始点,补充图S3C和S3D分别示出了值2和值1片段,在最终(i= 10)iDeepSARM迭代之后,分别为1个片段。起始结构更加多样化,并且优化逐渐优先考虑值2(R2位置)的取代的苯环和值1(R1)的脂肪族取代基或在较小程度上的环己基衍生物。图4示出了在10次迭代中预测的化合物活性的伴随演变。总之,结果提供了一个成功的iDeepSARM优化算法的代表性示例。对于抑制剂JQ1,与BRD4复合的X射线结构可在蛋白质数据库(PDB)中获得[34]。图5A示出了该复合物以及针对JQl计算的MTM。为了比较,图5B示出了来自iDeepSARM优化(des-SARM)的候选化合物。命名为Comp001),预测其活性比对照组高150倍。比JQ1。该候选化合物的MTM显示出与JQ1的全局相似性,但在投影特征集中也显示出不同的差异,例如,在地图的左下象限中有一个额外的特征中心。使用AutoDock Vina生成候选化合物的对接模型[35]。当候选化合物对接到BRD 4时,使用与X射线结构中JQ 1观察到的相同的对映异构体。在该模型中,观察到与JQ1类似的假设结合模式,具有保守的相互作用,但也具有中等的结合模式。A. Yoshimori和J. 巴约拉特生命科学中的人工智能1(2021)1000158见图7。迭代sca替换。由iDeepSARM优化产生的具有恒定值1和2片段以及新的关键2结构(sca_olds)的SARM通过预测的活性显示颜色编码。关键2结构和相应的sca替代SARM以优化的顺序排列,并且关键2对数似然分数在括号中报告与原始密钥2-01相比的结构修改在R1和R2位置上的新取代基的模拟相互作用模式。4.4. iDeepSARM变体,用于sca更新替换我 们 还 设 计 了 一 种 替 代 iDeepSARM 架 构 , 用 于 替 换 密 钥 2(sca_old)。该变体进一步扩展了iDeepSARM的设计能力,因为除了为给定的尺度选择优选的R基团组合(值1/值2)之外,还可以优化AS的核心结构 为此,Seq2Seq模型的关键2(图2)。 1B)用于预训练和微调,如图所示。 早上6 在本文所示的示例中,KinaseSARfari化合物用于预训练,JQ1键2用于微调。在用于预训练的化合物片段化之后,生成关键2片段对以训练Seq2Seq(关键2)模型。 对于选定的密钥2,然后使用该密钥对微调模型2和通过基于非规范SMILES的枚举的数据增强获得的其他关键2片段[36]。使用选定的密钥2作为输入,然后应用微调模型来预测修改后的密钥2片段,如图6B所示。对于备选密钥,生成具有常数值1和值2片段的SARM变量, 对所得化合物进行活性预测以选择优选的候选物。经常使用的值1和值2片段分别是补充图S3D和S3C中所示的片段。使用微调模型,生成了300个密钥2片段用于iDeepSARM sca更新。 图图7示出了通过对数似然分数选择的前10个关键2片段。与上述JQ 1交联剂的值1和2(R-组)优化相比,化合物活性没有持续改善,如补充图S4所示,表明JQ 1交联剂难以更换。含有关键2- 09的化合物,其中JQ1中的甲基被氨基取代,显示出与含JQ1的化合物相似的活性。重要的是,在优化过程中获得的关键2片段在JQ1骨架中显示出多种结构修饰,因此为iDeepSARM通过生成许多新的结构变体优化复杂环结构的能力提供了原理证明5. 结束讨论在本文中,我们已经介绍了一种用于化合物优化的计算方法,该方法建立在SARM/DeepSARM框架的基础上,并进一步扩展了其分子设计能力。iDeep-SARM方法的核心是基于RNN架构的迭代优化方案,该架构使用DeepSARM结果作为输入。迭代微调 iDeepSARM模型由一种新的基于CNN的活动预测方法以及用于可视化的矩阵变体支持。重要的是,iDeepSARM适用于优化R-基团组合和单个sca-模板,这代表了一种新的功能。对于由复杂环系组成的标度体,A. Yoshimori和J. 巴约拉特生命科学中的人工智能1(2021)1000159得到了R-基团和sca-基团优化可以以互补的方式进行除了活性,还可以优化其他分子性质,包括各种物理化学性质,如疏水性或溶解性和ADMET相关性质,如膜渗透性或代谢稳定性。基于SARM的多迭代对数似然和属性值分布的可视化使得可以以直观的方式监测优化期间的进展,如本文报道的示例性设计应用所示。iDeepSARM优化可用于具有单或多靶活性的化合物此外,当只有有限数量的对感兴趣的靶标具有活性的化合物可用时,它们可以专门用于微调,而预训练可以用对相关或远相关靶标具有活性的化合物进行。此外,iDeepSARM建模将生成式复合设计集中在给定的AS及其结构特征上,符合命中领先和领先优化的要求。鉴于对现有AS的关注,新设计的候选化合物的合成可及性目前,只有少数计算方法可为电极导线优化提供支持[6-10]。然而,这些方法本质上是统计学的和/或便于SAR可视化,但不包括复合设计。从这个角度来看,iDeepSARM目前在以迭代方式生成新候选化合物和监测计算优化进展的能力方面是独一无二的,这应该对药物化学和药物设计的实际应用感兴趣。申报利益作者声明,他们没有已知的竞争性经济利益或个人关系,可能会影响本文报告的工作补充材料与 本 文 有 关 的 补 充 材 料 可 在 在 线 版 本 中 找 到 , 网 址 : doi :j.ailsci.2021.100015。引用[1] Agra FiotisDK,Shemanarev M,Connolly PJ,Farnum M,Lobanov VSSAR地图。一种新的SAR可视化技术。医学化学杂志2007;50:5926-37.[2] PeltasonL , Bajorath JSAR 索 引 。 量 化 构 效 关 系 的 性 质 医 学 化 学 杂 志2007;50:5571[3] GuhaR,Van Drie JH. 结构-活动景观指数:确定和量化活动景观。JChem InfModel 2008;48:646[4] Renner S,van Otterlo WAL,Seoane MD,Möcklingho WAL S,Hofmann B,Wetzel S,etal. 化学空间的生物活性导向绘图与导航Nat Chem Biol 2009;5:585[5] Wawer M,BajorathJ.局部结构变化,全局数据视图:图形子结构-活动关系跟踪。JMed Chem 2011;54:2944[6] Nicolaou CA,Brown N,Pattichis CS.使用计算多目标方法的分子优化。Curr OpinDrug Discov Develop 2007;10:316[7] Munson M,Lieberman H,Tserlin E,RocnikJ,GeJ, Fitzgerald M,et al.铅优 化 损 耗 分 析 (LOAA ) : 药 物 化 学 的 一 种 新 的 通 用 方 法 今 日 药 物 发 现2015;20:978[8] [10] Shanmugasundaram V,Zhang L, Kayastha S,de la Vega de León A,Dimova D,Ba-jorath J. 在先导化合物优化过程中监测构效关系信息的进展JMed Chem 2015;59:4235[9] MaynardAT,Roberts CD. 量化、可视化和监控潜在客户优化。JMed Chem2015;59:4189[10] 作者:DavidM,J. 计算方法来评估铅优化的进展。JMed Chem 2018;61:10895[11] Wassermann AM,Haebel P,Weskamp N,Bajorath JSAR矩阵。从大型复合数据集自动提取信息丰富的SAR表 J Chem Inf Model 2012;52:1769-76.[12] Yoshimori A, BajorathJ.Deep SAR MatriX: SAR MatriX EX pansion for AdvancedAna-log Design Using Deep Learning Architectures.Future Drug Discov 2020;2 :FDD36.[13] HussainJ,Rea C.大数据集中识别匹配分子对的计算效率算法JChem Inf Model2010;50:339[14] 放大图片作者:J. 基于邻域的SAR矩阵预测新活性化合物。JChem Inf Model2014;54:801[15] Yoshimori A,Tanoue T,BajorathJ.药物化学应用中结构-活性关系矩阵方法与分子网格图和活性景观模型的集成。ACS Omega 2019;4:7061[16] Gupta-Ostermann D,Hirose Y,Odagami T,Kouji H,BajorathJ.使用“SAR矩阵 x”方 法 和 矩 阵 x导 出 的 活 性 条 件 概 率 进 行 前 瞻 性 化 合 物 设 计 F1000Res2015;4:75.[17] 张晓刚,李晓刚,张晓刚.用SAR矩阵法预测MMP-1抑制剂活性曲线及其实验验证Sci Rep 2020;10:14710.[18] 张文,张文.使用SAR矩阵方法开发基于姜黄素的阿尔茨海默病淀粉样蛋白聚集抑制剂Bioorg Med Chem 2021;46:116357.[19] 魏宁格湾SMILES是一种化学语言和信息系统。1.一、方法和编码规则简介。JChem Inf Comput Sci 1988;28 31-36.[20] Hochreiter S,SchmidhuberJ.长短期记忆。 Neur Comput 1997;9:1735-80.[21] Zheng S,Yan X,Gu Q,Yang Y,Du Y,Lu Y,et al. QBMG:quasi-BiogenicMolecule Generator with Deep Recurrent Neural Network. JCheminf 2019;11:5.[22] SutskeverI,Vinyals O,Le QV.序列到序列学习与神经网络。高级神经信息处理系统2014;1 3104-3112。[23] 凯 特 卡 河 Keras介 绍 上 一 篇 : 用Python 进 行 深 度 学 习 Berkeley, CA: Apress;2017.p. 97-111[24] 吉森利用分子拓扑图预测分子性质。分子2021;26:4475。[25] Bishop CM , SvensénM , Williams CKGTM. 生 成 式 地 形 图 。 NeurComput1998;10:215-34.[26] 加斯帕·哈。ugtm:一个使用生成地形图进行数据建模和可视化的Python软件包JOpen Res Softw 2018;6:26.[27] 钟S,胡军,余晓,张宏.分子图像卷积神经网络(CNN)辅助QSAR模型预测污染物对OH自由基的反应性:迁移学习,数据增强和模型解释。Chem EngJ2021;408:127998.[28] 张,H.;西塞,M.; Dauphin,Y. N.; Lopez-Paz,D. MIXUP:超越经验风险最小化。预印本arXiv:1710.09412(2017)。[29] 放 大 图 片 作 者 : Rogers D. EX tended-Connectivity 指 纹 。 JChem Inf Model2010;50:742-54.[30] YoshimoriA,Bajorath J. 将DeepSARM方法用于双靶配体设计。计算机辅助分子生物学杂志2021;35:587[31] LiuZ,Wang P,Chen H,Wold EA,Tian B,Brasier AR,et al. 靶向含溴结构域蛋白4的药物发现JMed Chem 2017;60:4533[32] BentoAP,Gaulton A,Hersey A,Bellis LJ,Chambers J,Davies M,KrügerFA,Light Y,Mak L,McGlinchey S,Nowotka M,Papadatos G,Santos R,Overington JP. ChEMBL生物活性数据库:更新。Nucleic Acids Res 2014;42:D1083[33] 奥普图纳超参数优化框架。https://github.com/optuna/ optuna.[34] Berman HM , WestbrookJ , Feng Z , Gilliland G , Bhat TN , Weissig H ,Shindyalov IN,Bourne PE.蛋白质数据库核酸研究2000;28:235-42。[35] 作者声明:A. AutoDock Vina:通过新的评分功能,高效优化和多线程提高停靠的速度和准确性。计算化学杂志2000;31:455-61.[36] Bjerrum,E.J. SMILES枚举作为分子神经网络建模的数据增强。预印本arXiv:1703.07076v2(2017)。
下载后可阅读完整内容,剩余1页未读,立即下载
cpongm
- 粉丝: 5
- 资源: 2万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 探索数据转换实验平台在设备装置中的应用
- 使用git-log-to-tikz.py将Git日志转换为TIKZ图形
- 小栗子源码2.9.3版本发布
- 使用Tinder-Hack-Client实现Tinder API交互
- Android Studio新模板:个性化Material Design导航抽屉
- React API分页模块:数据获取与页面管理
- C语言实现顺序表的动态分配方法
- 光催化分解水产氢固溶体催化剂制备技术揭秘
- VS2013环境下tinyxml库的32位与64位编译指南
- 网易云歌词情感分析系统实现与架构
- React应用展示GitHub用户详细信息及项目分析
- LayUI2.1.6帮助文档API功能详解
- 全栈开发实现的chatgpt应用可打包小程序/H5/App
- C++实现顺序表的动态内存分配技术
- Java制作水果格斗游戏:策略与随机性的结合
- 基于若依框架的后台管理系统开发实例解析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功