深度学习解释分子图像多任务模型的应用潜力

8 浏览量更新于2023-12-06 收藏 1.82MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

生命科学中的人工智能2（2022）100048研究文章实验设计支持的分子图像多任务清除模型的解释Andrés Martínez Moraa，Mickael Mogemarka，Vigneshwari Subramaniana，Filip Miljkovićb，a成像和数据分析，临床药理学和安全科学，研发，阿斯利康，瑞典b药物化学、研究和早期开发、心血管、肾脏和代谢（CVRM），生物制药研发，阿斯利康，瑞典aRT i cL e i nf o保留字：代谢稳定性卷积神经网络模型可解释性深度学习药代动力学a b sTR a cT深度学习（DL）架构的最新方法进步不仅提高了性能，预测模型，但也提高了他们的解释能力的潜力，从而大大增加了他们的transparency。在药物化学的背景下，不仅能准确预测分子特性，而且能从化学上解释它们的潜力将是非常优选的。之前，我们开发了准确的多任务卷积神经网络（CNN）和图形卷积神经网络（GCNN）模型，分别从基于图像和图形的分子表示中预测一组不同的内在代谢清除参数。在本文中，我们介绍了几个模型可解释性框架，以回答从CNN和GCNN多任务清除模型获得的模型解释是否可以应用于预测与实验证实的代谢产物相关的化学转化。我们显示了CNN像素强度和相应的清除预测之间的强相关性，以及它们对不同分子取向的鲁棒性。使用实际案例的例子，我们证明了CNN和GCNN的解释经常相互补充，这表明它们在指导药物化学设计中具有很高的组合使用潜力介绍机器学习（ML）作为更大的人工智能（AI）方法谱的一部分，继续在无数的药物化学和药物发现应用中获得相当大的关注[1这些方法通常用于推导一系列不同分子特性的统计定量-结构特性关系（QSPR）模型，如生物活性[5]、动物[6]和人体[7]药代动力学以及毒性[8]。通常，这些模型学会将可用化学结构的结构模式（通常编码为预定义的分子特征（描述符）或基于图形的嵌入）与通过建立的实验程序获得的感兴趣的分子特性相关联[9]。如果得到适当验证，这些模型可能会以极高的准确性外推所学习的分子特征，并使其能够应用于新的化学系列，这在新候选分子的发展中起着重要作用。在这方面，预测的化学转化条件所需的分子性质可以优先化的早期，因此缩短了设计-制造-测试-分析周期的长度。此外，不仅可以准确预测分子终点，而且还可以化学解释它们，这将是非常重要的。在药物化学实践中被提及。显然，近年来，模型可解释性作为一种方法框架引起了人们的极大兴趣，该框架旨在识别与因变量相关的化学修饰，从而导致观察到的实验测量[10模型解释，有效地结合专家知识，有可能更方便地指导合理的药物设计，从而鼓励药物化学从业者阅读应用计算机模拟方法。因此，通过应用集成或附加的可解释性架构的模型辅助假设生成可以进一步传播计算方法在制药科学中的接受度。与获得的关注相反，可解释的机器学习只有很少的实际探索，因为大多数模型开发都集中在提高性能准确性上，但只有很小的成功。有关用于属性预测的可解释ML模型的更详细讨论，请参阅最近的一篇透视文章[16]。深度学习（DL）作为机器学习的方法论组成部分，在生物和医学科学方面取得了重大进展，特别是在卷积神经网络（CNN）基本上得到应用的图像分析方面[17，18]。毫不奇怪，已经尝试重新利用预先建立的CNN框架来预测基于分子图像的不同化合物性质[19∗ 通讯作者：Pepparedsleden 1，SE-43183 Gothenburg，Sweden. 电话：+46-73-699-3320。电子邮件地址：filip. astrazeneca.com（F. Miljković）。https://doi.org/10.1016/j.ailsci.2022.100048接收日期：2022年9月27日;接收日期：2022年11月7日;接受日期：2022年12月1日2022年12月2日在线发布2667-3185/© 2022作者。由Elsevier B. V.发布。这是一个CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）可在ScienceDirect上获得目录列表生命科学期刊首页：www.elsevier.com/locate/ailsciA. Martínez Mora，M. Mogemark，V. Subramanian等人生命科学中的人工智能2（2022）1000482在这方面，分子图像用于表示学习，以将像素中编码的隐含化学信息与一个习得的实验终点获得了与最先进的结构表示具有同等精度的高度预测模型，表明基于分子图像的模型具有应用于各种分子性质预测任务的潜力然而，显着的性能优势，更简单的结构为基础的ML模型，还没有达到。CNN模型的一个潜在优势是最近越来越多的可解释性方法，特别是对于医学图像分析[24]。在医学成像中，很明显，如果没有模型解释，仅将CNN方法应用于预测标签输出的价值将非常小[24]。因此，已经做出努力来适应现有的医学图像应用并引入新的可解释性方法，从而增加了利用CNN模型的实用性和信心[24]。就像临床医生一样，药物化学家也需要模型解释来帮助决策过程，但也要揭示隐藏的数据趋势，否则这些趋势会被忽视。尽管在医学成像中使用可解释性方法有着悠久的传统（读者可参考最近的综述文章[24]），但在分子图像上的应用只是最近才被考虑。例如，Zhong et al. 开发了CNN模型来预测化合物对OH自由基的速率常数，然后使用梯度加权类活化映射对其进行解释[25]。这些解释正确地表明了负责分子反应性的结构特征[25]。在另一项工作中，Iqbal et al.研究了分子图像，以区分形成活性靶标（AC）的结构类似物和不形成活性靶标的结构类似物[21]。除了确定分子图像可用于高精度预测AC外，卷积层的梯度权重映射还识别了有助于这些预测的特征结构特征[21]。在这项工作的扩展中，作者从AC/非AC对的图像中学习了频繁出现的官能团，以建立迁移学习模型，旨在提高CNN模型的准确性和可解释性[26]。他们证明，功能组预测模型的重新训练此外，他们使用可视化来讨论基于CNN模型学习官能团化学的能力的性能改进的基本原理[26]。之前，我们系统地探索了多任务CNN模型的应用，以根据分子图像表示预测不同的体外清除终点[23]。我们证实，CNN在使用几种越来越具有挑战性的数据分割策略来捕获图像中包含的隐含化学关系方面非常出色。此外，使用基于结构的表示训练的传统ML和DNN方法以及图卷积神经网络（GCNN）进行的模型基准测试显示出相同或更高的准确性方法和材料固有清除率数据关于用于CNN和GCNN模型构建、评价和可解释性探索的固有清除率数据的详细信息在其他地方描述[23]。简而言之，从阿斯利康内部来源提取并管理人肝细胞固有清除率（HH CLint）、人肝微粒体总共确定了139，907种独特化合物用于模型构建和评价，不同清除参数的可用数据点数量不同。例如，HLM CLint和RH CLint测量值（作为化合物合成时最常用的清除参数）分别可用于101，913和79，043种化合物，而HHCLint和DH CLint（相对较晚进行评价）分别仅可用于21，616和6747种化合物。出于模型评估和可解释性的目的，CNN和GCNN模型使用相同的随机分层80/20训练测试集分割[23]。卷积神经网络模型在此之前，我们系统地探索了多任务CNN模型的应用，以从分子图像表示中准确预测四个常用的内在代谢清除参数[23]。CNN包括许多卷积块，它们从相邻的图像像素中提取特征，然后是非线性映射和池化运算符，它们以不同的尺度学习这些特征然后，通过一个全连接的块处理E-x特征，该块结合了矩阵乘法和非线性映射，以提供最终的预测值。研究了不同的CNN架构、超参数组合和图像表示，以建立最终的预测模型。我们对训练集（总数据的80%）进行了三重交叉验证，目的是选择最佳超参数集。在交叉验证过程中，提前停止15个epoch（最多150个）的耐心（两个折叠用于训练模型，剩余的折叠用于验证它们），以减轻潜在的过度拟合。决定系数（R2）和均方根误差（RMSE）被用来评估模型的性能，后者也被应用在交叉验证阶段。性能最好的CNN模型包含ResNet[27] 152架构，两个完全连接的层，辍学率为0.50，批量大小为128，学习率为2× 10−4，Adam优化器，批量归一化，并使用Huber损失进行优化[28]。此外，我们还研究了几种分子图像表示方法，并选择了240× 240 pixelCNN具有明显的多任务学习优势我们的发现表明二维分子结构的嵌入从分子图像构建的CNN模型可以成功地用于学习多个清除参数[23]。在这里，我们扩展了我们的研究问题，以回答从分子图像构建的CNN模型以及方法学上相似的GCNN模型是否可以用于解释与内在代谢反应相关的化学修饰。了解药物代谢转化的机制对小分子治疗药物的开发具有广泛的意义，包括但不限于体内药物活性（药效学）、分布和消除过程（药代动力学）以及可能归因于给药（潜在蓄积效应）、靶向药理学或化学反应性的安全性责任。我们在实践中说明了我们的可解释性模型的潜力，我们试图将模型衍生的解释与通过相应清除试验获得的实验证实的代谢产物相我们的发现呈列如下。0.03 μ m/π× EL的分辨率和重原子的彩色编码再现（例如，红色代表氧，蓝色代表氮，等等）作为最终模型输入。与基于结构和图形的指纹训练的最先进的机器学习方法相比，这些模型显示出同等或更高的准确性，在随机测试集上表现相当好：HH CLint（R2= 0.57± 0.003，RMSE= 0.32± 0.001），HLM克林特（R2）=0.57±0.001,RMSE=0.31±0.001），右侧CLint（R 2= 0.58 ± 0.001，RMSE = 0.36 ± 0.001），和 DH 克林特（R2）=0.52 ±0.005, RMSE =0.36±0.002）[23]第10段。图卷积神经网络模型与CNN一起，我们还报告了使用GCNN的多任务清除模型的性能[23]。在这里，应用了名为Chemprop[29]的定向消息传递神经网络框架，A. Martínez Mora，M. Mogemark，V. Subramanian等人生命科学中的人工智能2（2022）1000483结合了从分子图表示（原子编码为节点，键为边）中提取的特征和端到端方式的预测潜力[29]。作为一种概念上接近CNN的方法，GCNN在多任务设置中显示出相当的性能最佳GCNN模型配置有四个消息传递层，GCNN层大小为900，两个前馈层，丢弃率为0.15，RMSE作为损失函数。对于相同的随机测试集，GCNN模型显示出与CNN相当的性能：HH CLint（R2= 0.57± 0.02，RMSE= 0.31± 0.01），HLM CLint（R2=0.53± 0.03，RMSE= 0.33± 0.01），RH CLint（R2=0.58± 0.02，RMSE= 0.36±0.01），和DH CLint（R2=0.48± 0.0 2，RMSE= 0.37± 0.0 1）[23]。这毛皮-其他合格的CNN和GCNN清除模型，用于其比较可解释性评估。基于图像的模型我们研究了几种常见于CNN任务的现有可解释性框架：• 类激活图（CAM）：通过将学习到的模型梯度从每个预测的清除终点传播到卷积主干的最后一层来提供解释学习的梯度和评估的图像之间的相互作用的压缩低维表示[30]。学习的梯度可以被认为是每个图像元素对最终模型预测的贡献。由于卷积骨干的最后一层的表示是低维的，因此需要通过插值算法将其上采样到其原始大小。这产生了粗颜色的补丁，然后投影到查询图像的相应结构特征的顶部，这反过来又提供了描述增加或减少的间隙贡献的信息。CAM使用PyTorch实现[31]。• Shapley加法解释（SHAP）：一种模型不可知的方法，使用Shapley值的近似来解释不同的图像像素。源于博弈论，SHAPAP-PROX-imates每个图像像素对CNN模型得出的最终预测值的贡献[32]然后将这些值近似为通过查询图像的扰动构建的局部线性模型的权重，随后将其拟合到CNN输出[33]。SHAP方法使用Captum li-tool实现[34]。• 集成梯度（IG）：该方法比较由在基线图像上训练的模型学习的梯度由“零”像素组成的图像与从查询图像导出的那些相关联。通过在基线和查询图像之间生成插值来逐步执行评估，这允许对对预测贡献最大的梯度进行深入评估[35]。显示最大变化的子图被认为提供关于分析的图像像素的最相关的当IG在像素水平上探索图像贡献时，它们为所获得的解释提供类似的细节分辨率（即，每个PI× EL被单独解释）。与SHAP类似，IG方法向结果解释引入了一定程度的随机性（即使使用固定的随机种子），尽管程度低于SHAP。为提高耐用性，该方法运行四次，并对输出进行平均以得出最终解释。使用Captum库应用IG方法[34]。• 遮挡：一种消融方法，用噪声块替换查询图像的块，从而评估模型输出的变化在模型输出中显示最大差异的像素被解释为对预测贡献最大[36]。生成的斑块大小为15× 15像素，窗口位移为8× 8像素，产生模糊的非局部解释。Captum库用于实现该方法[34]。从所调查的方法中，只有CAM和IG进行了可解释性讨论。其他两种方法（SHAP和Oc- clusion）由于不同的原因被丢弃：SHAP输出受到扰动图像随机性的高度影响（四次预测重复与平均最终输出明显不同），Oc- clusion方法与其他方法相比执行得明显较慢，使其应用最不实用。通过数学评估CAM/IG解释与模型获得的预测值之间的关系，对CNN解释方法进行全局评估对于各预测化合物，提取各清除率终点的两种方法得出的判读层（用于叠加在分子图像上的判读性目的）的平均PIXel强度（作为图像PIXel值的平均值对于CAM和IG方法，将平均像素强度在0和10之间的值范围内归一化。1. 由于IG仅提供构成分子结构的像素的解释，因此仅考虑这些像素进行评价。计算平均像素强度和预测值之间的皮尔逊相关系数，此外，我们简要讨论了数据增强的影响（即，分子结构的不同旋转）对CNN模型预测和解释的鲁棒性的影响。基于图的模型Chemprop GCNN框架[29]包含一个内置的可解释性模块，该模块依赖于蒙特卡洛树搜索（MCTS）算法。对于每种化合物，MCTS算法按照随机顺序迭代评估所有可能的分子子结构对最终预测的贡献[37]。最大子结构尺寸被定义为超参数之一，以减轻计算成本。因此，最好地满足尺寸要求的采样子结构基序被选择为最相关的一个。针对特定子结构分析的所有图节点和边彼此相邻，这将输出限制为单个连续子结构模式。与基于图像的方法相比，这是一个主要区别，鉴于代谢转化可能发生在多个通常不连接的亚结构位置，基于图像的方法也造成了限制。与CAM和IG不同，MCTS不提供关于每个突出显示的分子片段的贡献水平的信息。CNN和GCNN方法的伪代码包括在补充方法的图S1中。实验提出的代谢产物肝微粒体和肝细胞可用于研究可能在人和不同动物种属中观察到的潜在氧化（微粒体和肝细胞）和结合（仅肝细胞）代谢途径。为了保护与人类直接相关的代谢热点，通过体外系统鉴定代谢产物（代谢身份或MetID）在验证动物物种用于筛选和合成计划方面发挥着至关重要的作用。有时，将制备用于固有清除率测量的样品提交给定性液相色谱-质谱（LC-MS）评价。对于分析，获得紫外（UV）色谱图和质谱。应用UV色谱图定量每个峰，以运行百分比（%）表示。随后，通过质谱获得代表>5% UV色谱图的峰在这里，我们的目标是将CNN和GCNN框架获得的解释与实验提出的代谢转换相关联。A. Martínez Mora，M. Mogemark，V. Subramanian等人生命科学中的人工智能2（2022）1000484Fig. 1. 识别分子以进行可解释性评估。如文中所述，对分析进行了总结。结果和讨论可解释性评估我们系统地检索了测试集，以寻找已识别出内部衍生MetID的公开化合物。总结如图所示。1.一、如上所述，CNN和GCNN模型都此外，针对相应解释的平均像素强度评估测试集预测，以评估解释方法对实际CNN预测的灵敏度。在28，025个分子中，4354个（16%）公开了其化学结构。从这些化合物中，我们选择了2394种化合物（55%），这些化合物在CNN和GCNN模型的两倍误差范围内预测至少有一个共同的清除终点。选择两倍预测误差（0.30对数单位）来反映肝细胞和微粒体清除率测定的实验误差[23]。此外，我们仅检查了具有内部可用MetID的化合物的相应清除率。根据这些标准，只有1%的初始测试组化合物（185个分子）符合我们的分析要求。从中，我们选择了几个例子进行讨论，每个预测的清除终点一个。CNN和GCNN模型的性能鲁棒性为了评估新化学系列的性能稳健性，我们应用 Bemis-Murcko（BM）sca rankold定义来估计随机定义的训练集和测试集之间的化学重叠[38]。我们在数据中识别了64，393个独特的BM标记，其中6328个在训练集和测试集之间共享，分别对应于54，292和17，757种化合物。考虑到随机分裂的随机性，这种高重叠是可以预期的，这也可能限制机器学习模型准确预测新化学的潜力。在这方面，我们仅分析了构成测试集的单元素化合物（10，268个分子）的模型根据BM scaf-折叠定义没有其他类似物的分子）。我们的模型的更具挑战性的数据分割策略之前在其他地方进行了检查[23]。图S2显示了CNN和GCNN模型对于每个单独清除终点的性能，如对所有和仅单例测试集分子所评价的。所有化合物和仅单一化合物之间的性能差异不显著（最高达0.03，取决于终点），表明模型能够准确预测属于非单元素化合物的化合物看到化学。假设符合可解释性分析条件的185个分子中没有一个然而，考虑到模型对于单元素分子是预测性的，不能完全排除导出的可解释性模型也将此外，我们评估了满足上述标准的化合物相对于不确定性估计CNN的不确定性估计是通过旋转扰动获得的（相同分子的不同方向用作输入），而对于GCNN，不确定性是使用三个模型检索的，这些模型具有在相同条件下训练的不同种子值。图S3显示了CNN和GCNN预测在不同清除终点之间的标准偏差的BOX图分布。我们注意到，当关注单个建模框架时，所讨论的间隙测量的不确定性分布相对一致。GCNN模型的预测不确定性略高，与等效CNN模型相比，标准差分布更宽。CNN和GCNN分布的中值都可能需要进一步研究使用实验误差估计的不同校准方法，这是实际应用的持续关注领域。CNN解释方法的灵敏度我们对CNN解释方法对相应预测值进行了全局敏感性分析。为此目的，将每种解释化合物的归一化平均pixel强度与每个终点获得的模型预测相关联。图2显示了不同清除终点和解释方法之间的强相关性，证实了解释方法突出显示的区域对预测值的量级敏感。这种相关性在CAM中稍强，因此使该方法更灵敏。奇怪的是，CAM在所有端点上都显示出强烈的负相关性（与IG相反），这可能归因于用于构建CAM的潜在空间。因此，在CNN训练期间，CLint值被映射到低潜在空间值是合理的，这进而在CAM中产生负相关其他潜在原因包括应用高度插值算法来相对于原始图像维度对潜在CNN维度进行重采样，以及颜色图选择，其中低PIXel强度被分配给高CLint值，反之亦然。我们还研究了CNN解释方法对不同分子取向的敏感性。由于我们的模型最初是使用不同的增强技术构建的，并且对许多分子图像增强具有鲁棒性，因此我们推断所研究的CNN解释方法应显示与支持它们的模型CNN解释显示对不同分子取向的旋转不变性的能力将证明它们在实际环境中对扰动攻击的弹性（例如，当要求以特定姿态显示分子结构时考虑到分子图像的制备遵循一组预定义的规则（参见卷积神经网络模型部分），其他扰动方法（如图像模糊、遮挡掩模的应用或图像块的替换）的意义不大，这与其他图像分析应用不同，在其他图像分析应用中，通常会考虑原始图像和质量不足的图像如图补充材料S4-S5中，预测的间隙值和解释中强调的结构特征在不同旋转中是一致的。显然，预测可靠性和解释一致性的确认为药物化学中基于分子图像的方法的实际考虑建立了强有力的先决条件，如下节所示。A. Martínez Mora，M. Mogemark，V. Subramanian等人生命科学中的人工智能2（2022）1000485图二. CNN解释方法的全局敏感性。散点图显示了两种CNN解释方法（CAM，顶部; IG，底部）的归一化平均像素强度与预测的CLint值（HH CLint，蓝色; HLM CLint，橙色; RH CLint，红色; DH CLint，绿色）之间的相关性。在每个图的右上角，Pearson表1Spearman相关系数表明不同可解释性方法之间的一致性。方法对HH CLintHLM CLintRH CLintDH CLintCAM0.100.060.050.09CAM-MCTS0.430.560.050.40IG0.020.040.020.01可解释性方法对于满足我们标准的化合物，我们通过从解释图中提取像素值并计算成对Spearman相关系数，研究了三种解释性方法（CAM、IG和MCTS）之间斯皮尔曼相关系数越大，方法之间的一致性越大，从而证明它们突出相同亚结构基序的能力。假设MCTS方法在本文中应用于分子图，我们为MCTS输出建立了等效的图像表示，其中分子结构的突出显示部分被分配为1的PIX没有根据MCTS的贡献）保持在0。表1总结了成对方法比较获得的Spearman相关系数，如在所有四个清除率终点中评估的。尽管应用于不同的数据格式和模型架构，CAM和MCTS显示，所有方法对中的最高相关性。最大的分歧是政府间组织和多边贸易体制之间的在终点方面，RH CLint显示方法对之间的变异性最大，总体评分系数值最低。总之，Spearman相关系数显示，大多数方法和清除终点之间无有意义的相关性，表明当一起应用时，它们的解释最多是互补的。解释示例为了简化模型可解释性分析，对每种解释方法进行编程，以产生一个以预先指定的着色方案为特征的解释层，然后将其叠加到预测的分子图像上。对于CAM和IG（CNN模型），应用连续色标来指示代谢转化的增加倾向：CAM从深蓝色到橙色，IG从蓝色到红色。对于MCTS（GCNN模型），仅考虑并突出每个化合物的最有贡献的分子亚结构，这也对该方法提出了限制。不同化合物和清除终点的Ex实验室解释见图1和图2。三比六图中所示的实验和预测清除率值均以对数标度给出如图3所示，化合物A具有1.25的中等高的实验HH CLint，并且被CNN和GCNN模型准确地预测，仅显示0.06的边际误差差异，A. Martínez Mora，M. Mogemark，V. Subramanian等人生命科学中的人工智能2（2022）1000486图三. 化合物A的HH CLint预测的解释。示出了针对化合物A的预测HH CLint终点获得的CNN和GCNN模型解释。解释与完整的MetID方案，以及每个模型的实验和预测的终点值。分别为0.16。实验获得的化合物A的HH CLint MetID显示，48%的分子保持不变（未经历HH CLint代谢），而41%代谢转化为合理产物。剩余的11%无法通过LC-MS程序进行化学表征主要代谢产物通过氧化和葡萄糖醛酸化（22%）、仅去饱和（8%）、仅葡萄糖醛酸化（6%）以及去饱和和葡萄糖醛酸化的组合（5%）的连续转化获得。检测到N-（吲唑和吡啶的氮）和O-葡萄糖醛酸化（羧酸的羟基）反应，而使脂族链中发现的SP3碳经历去饱和。氧化过程发生在吡啶环上。对于CNN模型解释，经历葡萄糖醛酸化的官能团显示出最低的代谢转化倾向（CAM和IG）（图3）。另一方面，通过CAM和IG方法，脂肪链周围区域（邻近苯环）的特征在于具有更大的像素强度，尽管这种转化在实验上被量化为对代谢输出的贡献最小。吡啶环的氧化突出显示为具有CAM的平均强度和IG的略高强度至于A. Martínez Mora，M. Mogemark，V. Subramanian等人生命科学中的人工智能2（2022）1000487见图4。化合物B的HLM CLint预测的解释。所示为针对预测的HLM CLint终点获得的CNN和GCNN模型解释对于化合物B。解释补充了完整的MetID方案，以及每个模型的实验和预测端点值GCNN，MCTS算法突出了吲唑环作为对预测最有贡献的亚结构，根据可用的MetID，其通过N-葡萄糖醛酸化缀合。MetID建议进行葡萄糖醛酸化的羧酸醇尚未通过可解释性方法突出显示。然而，LC-MS无法区分潜在的转化位点或是否发生O-或N-葡萄糖醛酸化在本例中，所有三种可解释性方法都是相互补充的，而不是单一的方法突出显示所有实验检测到的代谢转化。对于HH CLint，该化合物与另外16种化合物共享相同的BM评分，其中12种在训练集中。图4显示了化合物B[39]，其具有高实验HLM Clint（HLM CLintexp=2.03）和预测CNN（HLM CLintpred= 1.97）和GCNN（HLM CLintpred=1.91）模型值。对于该化合物，HLM CLint MetID显示只有34%的代谢产物进行了化学表征。这可以进一步传播到A. Martínez Mora，M. Mogemark，V. Subramanian等人生命科学中的人工智能2（2022）1000488图五. 化合物C的RH CLint预测的解释。示出了针对化合物C的预测RH CLint终点获得的CNN和GCNN模型解释。解释补充了完整的MetID方案，以及每个模型的实验和预测终点值。氧化介导的开环（26%）、自由基过氧化（4%）和氧化（4%）机制，均检测到咪唑并吡啶环。事实上，咪唑并吡啶环的氧化性打开是可预测的，因为结构相似的吲哚通过P450介导的氧化作用进行相似的氧化性裂解[40]。CAM和IG都正确地将咪唑并吡啶部分（后者侧重于咪唑部分）作为代谢热点，这是所有三种已识别代谢产物的原因。此外，IGs预测吡唑和氧杂二唑作为经历代谢的额外结构基序另一方面，MCTS（GCNN模型）表明苯基吡唑部分是化合物B代谢的主要贡献特征。然而，不能完全排除在LC-MS未鉴别的代谢物中存在通过这些亚结构产生的副产物（或几种副产物）。对于HLM CLint，该化合物的BM评分包含在另外29种化合物中，其中18种是训练集的一部分图在图5中，化合物C显示相对低的实验RH CLint值（RH CLint exp=0.99），其被CNN（RH CLint pred= 1.23）和GCNN（RH CLint pred=1.29）模型略微过度预测。在此，MetID清楚地显示N-和O-葡萄糖醛酸化是主要的可定量代谢物（12%），而多种葡萄糖醛酸的氧化A. Martínez Mora，M. Mogemark，V. Subramanian等人生命科学中的人工智能2（2022）1000489见图6。化合物D的DH CLint预测的解释。示出了对于化合物D的预测DH CLint终点获得的CNN和GCNN模型解释。解释补充了完整的MetID计划，以及每个模型的实验和预测端点值。检测到官能团和芳环，但未通过LC-MS定量。此外，还观察到了转化偶联、氧化和葡萄糖结合CAM正确地突出了三环的大部分作为潜在代谢位点，MetID证实了这一点，即发生氧化、葡萄糖醛酸化和葡萄糖醛酸结合。另一方面，IG表征具有低代谢转化倾向的三环氮，而四氢异喹啉环的叔胺周围的区域突出显示为高代谢倾向的区域在后者中，对于化合物类，例如所显示的四氢异喹啉和其它稠合芳基哌啶，活化的C-是众所周知的这些特别容易受到氧化代谢的影响（如MetID所示），这可能导致形成高反应性和XIC亚胺离子[41]。此外，CAM正确地突出显示苯环（根据MetID氧化），其仅部分被IG检测到对于CAM解释，显示了异丁基和迈克尔受体的sp2碳的平均PIXel强度，所有碳都经历氧化。sp2碳的氧化是A. Martínez Mora，M. Mogemark，V. Subramanian等人生命科学中的人工智能2（2022）10004810也得到了IG的确认。有趣的是，与图3不同，参与葡糖苷酸结合的羧酸的羟基被IG正确地MCTS算法仅强调4-甲基苯乙烯是对GCNN预测最有贡献的分子亚结构，MetID建议其进行氧化代谢。CAM检测到大部分代谢转化，IG仅在很小程度上补充CAM。对于RH CLint，该化合物与另外451种化合物共享其BM sca，其中359种存在于训练集中。图6讨论了化合物D，其具有0.78的低DH CLint和通过CNN（DHCLintpred= 0.73）和GCNN（DH CLintpred= 0.88）准确预测的值。大部分可用的原料化合物保持相对不变（77%）。报告了吡唑环（氧化，14%）和醚官能团（脱甲基，4%）的主要代谢转化，后者通过氧化进一步转化为羧酸部分（3%）。每个其余报告的代谢反应中，存在（甲基化、氧化、N-脱甲基化、N-氧化物形成和氧化/葡萄糖醛酸化）。CAM中的最高像素强度报告为醚基团，其经历O-脱甲基化、O-氧化和葡萄糖醛酸化。这一点在IGs中只得到了不明显的强调。然而，IG正确地将吡唑环解释为关键代谢热点（氧化和N-脱甲基），CAM仅以平均强度突出显示。在MCTS中，根据报告的主要代谢产物，结构扩展的吡唑模式被强调为最具贡献的分子特征吡啶、喹啉和酰胺氮的N-甲基化不被CAM捕获或IG。对芳基氧化和N-氧化物形成也进行了类似的观察。在这里，IGs和MCTS正确地预测了主要代谢转化的位置，而CAM则用检测到的对醚的修饰来补充解释结果。除了DH CLint MetID之外，化合物D还用HH CLint和RH CLint实验的MetID表征，其在补充材料中提供（图1A和1BS6-S7）。简而言之，HH CLint（图S6）和RHCLint（图S7）存在相似的代谢转化（但比例不同），其中86%的母体化合物D保存在HH CLint中，47%保存在RH CLint中。然而，我们注意到，相同的CNN解释方法突出了所有三个含MetID的清除终点的不同亚结构特征（图1和2）。 6，S6- S7）。对于HH CLint（图S6），CAM方法将最大像素强度分配给喹啉环，尽管它仅占检测到的化合物的1%。没有明确的亚结构特征优先考虑IG。另一方面，MCTS正确识别吡唑作为主要代谢热点（氧化和甲基化）。有趣的是，对于RH CLint（图S7），所有三种方法都正确预测吡唑环是经历RH代谢的主要亚结构基序，通过许多转化机制进行协调。除了该化合物之外，我们还检测到另外两种分子，其具有DH CLint测量值，共享相同的BM sca_id，两者都存在于训练集中。结论在本文中，我们探索了几种模型可解释性框架，这些框架建立在现有的多任务CNN和GCNN模型基础上，这些模型从内部固有清除率数据中学习。为此，我们应用CAM和IG来解释CNN预测，并应用内置的MCTS算法来解释Chemprop GCNN输出。对于充分的可解释性评估，仅考虑通过CNN和GCNN模型准确预测并使用化学表征的MetID内部报告的公开公开化合物进行分析。这使我们能够就基于CNN和GCNN的解释的适用性得出相对明确的结论，以解释通过实验设计获得的代谢相关化学修饰尽管在常见的子结构上进行了部分训练和测试，但这些模型被证明在看不见的化学物质上是稳健与所有测试集预测值相比，仅检测到RMSE值略有增加。假设MetID实验很少进行（主要是针对少数项目候选人），并且只有少数例子可以有效地解释，考虑内部生成的MetID的大规模可解释性评估将只能对此类模型的一般解释能力进行有限为了进行更全面的分析，需要更频繁地生成MetID实验（通常受成本限制），或者需要将大型制药公司聚集在一起的协作资源框架。然而，我们仍然证明了与解释层相关的平均像素强度与CNN预测高度相关。此外，不同方法突出显示的子结构之间仅有少量重叠，表明这些解释性框架可能为代谢热点评估生成补充信息此外，这些方法对分子图像的不同取向显示出强大的解释鲁棒性，这得到了这些图像中一致突出的亚结构特征的支持。在个案基础上，无法对任何评估的可解释性方法给予明确的认可，因为经常观察到CNN和GCNN解释是相互补充的。有趣的是，CAM和IG算法往往提供不同的解释，这可能是由于他们的全球和本地启用焦点，分别。此外，模型解释经常强调MetID未识别然而，如果LC-MS输出通常没有全部进行化学表征，则不能完全排除一部分未鉴定的代谢输出含有由模型相关亚结构基序产生的产物。由于这些原因，这些方法的应用可以被设想为一致地引导药物化学家例如，一旦获得了预测的清除率值，（n）（有经验的）药物化学家可能开始对特定的可解释性方法建立信心，根据化学家的经验，该方法为研究的药物化学型提供了合理的解释。这也将促使应用于化学结构的其他突出领域，这些领域不太容易去卷积，但可能导致例如很少观察到的与安全性相关的代谢转化。这样的怀疑后来可能会被广泛的文学研究所证实。在对特定化学系列了解较少的情况下，建议通过加权评分（其中重叠特征将获得更高的分数）或突出子结构的简单组合联合应用两个或更多个可解释性框架。假设代谢修饰可以同时发生在不同的，通常是不相连的亚结构基序上，并且一些可解释性模块经常只强调单一的结构位点，那么结合使用不同的解释方法将确保更好地覆盖潜在的转化位点。这些只是一些潜在的应用场景，值得我们进一步研究和关注。话虽如此，扩展这项工作的潜在未来方向包括但不限于：a）关于测量的实验误差的模型性能的改进，b）进一步探索可解释性方法和开发专注于分子图像表示的定制算法，c）关于使用和最佳实践的详细指导，包括何时和如何单独或组合地应用解释方法，以及d）在正在进行的药物化学项目上的持续应用和前瞻性验证。竞争利益作者声明，他们没有已知的竞争性经济利益或个人关系，可能会影响本文报告的工作。A. Martínez Mora，M. Mogemark，V. Subramanian等人生命科学中的人工智能2（2022）10004811补充材料与本文有关的补充材料可在在线版本中找到，网址：doi：j.ailsci.2022.100048。引用[1]拉维奇亚药物发现中的机器学习方法：方法和应用。药物发现。今日2015;20：318-41.[2] Lo Y，Rensi SE，Torng W，Altman RB.化学信息学和药物发现中的机器学习。药物发现。今天2018;23：1538-46.[3] MiljkovićF，Rodríguez-Pérez R，Bajorath J.人工智能对计算机的影响发现、设计和综合。ACS Omega 2021;6：33293[4] Rodríguez-Pérez R，Miljković F，Bajorath J. Machine learning in chemiformaticsandmedicinal chemistry.Annu. Rev. BioMed. 数据科学2022;5：43-65.[5] Rodríguez-Pérez R，Bajorath J.多任务机器学习用于分类高度和弱有效的激酶抑制剂。ACS Omega2019;4：4367-75.[6] ObrezanovaO，Martinsson A，Whitehead T，Mahmoud S，Bender A，MiljkovićF，[10]李文，李文.使用机器学习从化学结构预测大鼠体内药代动力学参数和时间-暴露曲线。摩尔Pharm. 2022;19：1488-504.[7] [10] Miljković F ， Martinsson A ， Obrezanova O ， Williamson B ， Johnson M ，Sykes A，Ben- der A，Greene N.用于人体体内药代动力学参数的机器学习模型及内部验证。摩尔Pharm. 20

下载后可阅读完整内容，剩余1页未读，立即下载