药物再利用的无监督计算管道识别亨廷顿治疗药物

158 浏览量更新于2023-12-06 收藏 1.77MB PDF 举报

人工智能

复杂疾病

身份认证购VIP最低享 7 折!

30元优惠券

生命科学中的人工智能2（2022）100042研究文章一个无监督的计算管道识别潜在的可重复利用的药物来治疗亨廷顿Luca Menestrina，Maurizio Recanatini药学与生物技术系，博洛尼亚大学，Via Belmeloro 6，40126博洛尼亚，意大利aRT i cL e i nf o保留字：计算药物发现药物再利用亨廷顿舞蹈a b sTR a cT药物再利用包括确定已知药物的其他用途，由于这些新发现是建立在根据以前的知识，它缩短了药物开发的时间和成本。在这项工作中，我们组装了一个用于药物再利用的自动计算管道，还集成了一个基于网络的分析，用于筛选可能的药物组合。药物的选择依赖于它们在蛋白质-蛋白质相互作用组上对疾病的亲合力和它们对疾病相关基因表达的影响。然后根据药物在人相互作用组上的分离和已知的药物-药物相互作用来优先考虑联合治疗。我们最终收集了一些分子，以及它们合理的组合，可以用于治疗亨廷顿舞蹈症和多发性硬化症。最后，这条管道也可能为其他复杂疾病提供新的建议介绍发现一种新药并将其推向市场是一个既耗时又相反，依赖于已建立的药物，计算药物重新定位提供了一种有价值的替代方法，用于为无法治愈的疾病提供有希望的治疗[1，2]。近年来，已经提出了大量的药物排斥计算方法，并将其应用于各种治疗领域[3]。大多数此类方法依赖于机器学习或传统的计算药物设计方法，尽管一些概念上的创新想法已经揭示了采取新途径预测潜在可重复利用药物的可能性。其中一种思路是基于系统观，以人类蛋白质-蛋白质相互作用组为参考网络，通过计算药物靶点与疾病相关蛋白之间该距离已被提出作为测量药物和疾病之间的“接近性”的合适度量[4]。最近，利用药物-疾病亲合性的概念[5]，已经提出了用于治疗心血管疾病[5，6]、癌症[7]、COVID-19[8]、阿尔茨海默病[9]的新药物适应症，证明了基于网络的在这项工作中，我们通过整合最近开发的方案来组装自动计算管道，以筛选可重复利用的药物，该方案将基于网络的技术与生物学分析相结合。计算和实验数据[10，11]，以及过滤所有可能的药物组合的策略[6]。最初，该程序估计疾病相关蛋白质与蛋白质-蛋白质相互作用组上的药物靶标之间的接近度，进行候选物的第一次选择。然后，只有那些显著影响疾病相关基因表达的药物才被认为是合理的。最后，评估这些药物在人相互作用组上的靶点的分离并考虑已知的药物-药物相互作用，优先考虑联合治疗。该过程的工作流程示意性地示于图1中。整个过程是自动化的，以减少人为干预，从而加快整个过程，并限制执行错误。我们将这一管道应用于亨廷顿舞蹈症（HD）和多发性硬化症（MS），因为尽管它们都是神经系统疾病，但它们的不同性质可能对我们的策略构成挑战，并且结果可以让我们深入了解其方法学优势和局限性。据报道，HD是一种典型的单基因疾病，尽管已知许多其他基因参与其进展[12]，而MS的单一遗传原因尚未发现，可能是因为许多因素在病因学中起重要作用。事实上，多发性硬化症很好地符合在网络医学框架内考虑的复杂疾病的另一方面，我们的研究中纳入了HD，以测试所提出的方法在不同临床表型可能与最终受遗传修饰剂影响导致不同病理生理状态的疾病模块相关的情况下的能力[12*通讯作者。电子邮件地址： maurizio. unibo.it（M. Recanatini）。https://doi.org/10.1016/j.ailsci.2022.100042接收日期：2022年5月4日;接收日期：2022年6月23日;接受日期：2022年7月20日2022年7月27日在线提供2667-3185/© 2022作者。由Elsevier B. V.发布。这是一个CC BY-NC-ND许可证下的开放获取文章（http://creativecommons.org/licenses/by-nc-nd/4.0/）可在ScienceDirect上获得目录列表生命科学期刊首页：www.elsevier.com/locate/ailsciL. Menestrina和M. 雷卡纳蒂尼生命科学中的人工智能2（2022）1000422Fig. 1. 管道流程图。该图表显示了筛选可重复利用的候选药物并对其组合进行优先排序的自动化程序的来源和步骤。HD是最常见的单基因神经系统疾病。发病期通常在成年的早期，其特征是运动功能障碍、认知障碍和神经精神特征[12，15]。导致HD的常染色体显性突变位于HTT基因中，并且其存在于胞嘧啶-腺苷-鸟嘌呤三核苷酸重复（CAG，编码谷氨酰胺）中，导致亨廷顿蛋白中多聚谷氨酰胺（polyQ）尾的过度扩增。突变的蛋白质倾向于聚集和积累，形成对神经细胞具有有害后果的包涵体。包涵体和CAG扩增的长度都被证明在疾病的发展中起重要作用。清除第一个会减缓HD进展，而CAG扩张时间越长，疾病可能越早出现[15]。HD病程的不确定性可归因于患者基因组中的其他遗传疾病[12，14]。MS是年轻人中最常见的非创伤性致残疾病[16]和最常见的脱髓鞘疾病[17]。导致其恶化进展的病因和机制尚不清楚，但已证明遗传和环境因素的复杂相互作用是重要的[18，19]。已知的主要风险因素是吸烟、儿童肥胖、感染爱泼斯坦-巴尔病毒和维生素D水平低[19]。MS通常被认为是一种两阶段的自身免疫性疾病，其中最初的局灶性炎症过程导致疾病的复发-缓解形式，随后脱髓鞘斑块（由先前的免疫应答导致的病变）和少突胶质细胞损伤导致神经变性和非复发性进展过程[17，19]。MS通常以进行性痉挛性轻瘫、认知障碍以及感觉和小脑功能障碍为特征[19]。HD和MS仍然缺乏解决性治疗[20，21]，其发展需要对潜在机制有更深入的了解[22]。为了这个目的，基于网络的模型，我们在这项研究中使用的它们将使我们能够考虑到这些疾病的潜在复杂结构，而不会失去一个清晰的观点[23]。通过本文介绍的方法，我们能够收集到许多获批的药物及其合理的组合，可用于治疗HD和MS。材料和方法本研究的工作流程可概括为以下步骤（图1）：（1）收集疾病相关基因;（2）通过富集分析验证基因集;（3）收集药物、靶标、蛋白质相互作用数据，构建蛋白质-蛋白质相互作用组;（4）计算人蛋白质-蛋白质相互作用组上的药物-疾病亲合性;（5）估计药物诱导的基因表达标记富集;（6）计算人相互作用组上的药物-药物分离。除了收集疾病相关基因外，每个操作都由Python 3脚本执行，整个过程由同一编程语言的主文件汇集和协调。疾病相关基因对于两种考虑的疾病中的每一种，从 KEGG[24]（https://www.genome.jp/kegg/）、OMIM检索[25]（https：//www.omim.org/），PheGenI[26]（ https://www.ncbi.nlm.nih.gov/gap/phegeni ）、 DISEASES[27]（https://diseases.jensenlab.org/搜索）和DisGeNET[28]（https://www.disgenet.org/）。简单地说，对于HD，从KEGG亨廷顿病途径“hsa 05016”检索306个基因https://www.disgenet.org/dbinfo#section36另一方面，对于MS，160个基因是针对NHGRI（国家人类基因组研究所）全基因组关联研究作为来源，p值1×10−8; 5从DISEASES数据库中检索; 30从DisGeNET中收集，条件与HD相同。<利用NCBI数据库将这些基因定位到特定的基因符号上，然后进行组合。本体（GO，HPO）富集分析功能富集分析通常用于对所研究的基因集进行初步分析通过对基因本体论[29]（GO，http://geneontology.org/）和人类表型本体论[30]（HPO，https://hpo.jax.org/）关联的研究，我们获得了与这些基因最频繁相关的生物学过程、分子功能、细胞组分和表型的见解。我们使用Python库GOATOOLS进行了功能丰富分析[31]并认为仅显著富集了错误发现率（FDR，使用Benjamini-Hochberg程序[32]进行多重比较校正的p值）低于1× 10−4的项。然后，我们查看了前20个术语，这些术语是根据它们的倍数丰富度排名的。（计算为研究组中与特定术语相关的基因百分比除以背景中相应百分比的比率，即，整个人类蛋白质组）。L. Menestrina和M. 雷卡纳蒂尼生命科学中的人工智能2（2022）1000423| |2⟨⟩��⟨ ⟩ ⟨⟩��药物和靶标收集、基因表达谱检索和蛋白质-蛋白质相互作用组构建每种药物与疾病之间的距离Δ（Δ，Δ）计算如下：��（药物信息来自DrugBank[33]（版本5.1.9）。仅考虑那些至少以一种人类蛋白质为靶标的分子，获得5 798个药物和2 755个相应的药物诱导的基因表达谱从基于集成网络的细胞特征库[34]（LINCS，谱http://www.ncbi.nlm.nih.gov/geo由于我们正在检查神经系统疾病，因此对神经细胞系（NEU，NPC，SHSY 5Y）测试的这些特征进行了两种疾病的检查此外，为了考虑疾病特异性特征，HD还包括肌肉细胞系（SKB、SKL），MS包括造血和淋巴组织细胞系（L60、JURKAT、NOMO1、PL21、SKM1、THP 1、U937、WSUDLCL 2）。此外，为了保证结果的最大可靠性，仅保留了这些配置文件中每个数据集（药物签名）中有关最佳推断基因（BING）的数据。BING子集包括978个标志基因和9 196个推断基因，这些基因是通过L1000检测中的12 328个基因中鉴定的。��t∈��∈其中，基于目标在相互作用组中的节点度对目标进行加权（如果目标与疾病相关，则λ=-ln（λ+ 1），否则λ= 0）。PPI是PPI网络中目标的度然后，对于每种药物，将测量的距离与虚拟参考分布的距离进行比较，评估其与所研究疾病相关性的显著性。通过计算10 000倍的距离（��（��，��），由等式（1）定义）获得该参考值。(1)疾病相关基因和随机选择的（从人类相互作用组）与药物靶点数量相匹配的蛋白质组之间的关系。由于在距离计算中已经考虑了药物靶标的程度，因此便于随机选择的蛋白质的采样，仅需要匹配药物靶标的数量而不需要匹配药物靶标的程度分布。使用参考分布的平均值 ��（��，��）和标准差 ��（��，��）将观察到的距离归一化为接近值（z评分）：Subramanian等人。[36]评估最可靠的推理预测。蛋白质间的强相互作用是完成许多生物过程和功能的关键因素。基于这个理由，��（( , )反向基因集富集分析（二）我们选择了一种基于网络的方法来评价药物与疾病或药物与其他药物之间的相关性。我们构建了一个人类蛋白质相互作用（PPI）网络，该网络结合了来自八个公开资源的数据：[37]（APID，http://cicblade.dep.usal.es:8080/APID/init.action），交互数据集的生物通用存储库 [38] （ Bi-oGRID ，https://thebiogrid.org/），人类参考Interac-tome[39]第三十九届（胡日，http://www.interactome-atlas.org/）、InnateDB[40]（https://www.innatedb.com/），INstruct[41]（http：//instruct.yulab.org/ ）、 IntAct[42] （ https://www.ebi.ac.uk/intact/home ）、Sig-naLink [43]（http://signalink.org/）和检索相互作用基因/蛋白质的搜索工具[44]（STRING，https://string-db.org/）。补充表1提供了有关数据库和应用的过滤器中报告的相互作用的其他信息。然后组合检索到的相互作用，获得由20 445个节点（基因/蛋白质）和1 125 173条边（相互作用）组成的网络（可在补充信息中获得）所有列出的蛋白质都利用NCBI数据库映射到特定基因符号，由于蛋白质-蛋白质相互作用组是整个过程的支柱，我们评估了其有效性，比较了基于其他两个相互作用组的整个分析结果。第一个研究是在Cheng等人广泛认可的相互作用组上进行的[5]（16 677种独特的蛋白质和243 603种实验证实的蛋白质第二个是在我们自己的相互作用组的严格限制的版本上进行的（16954种蛋白质和246080种相互作用），其中仅包括来自低通量研究的相互作用（列出少于20种相互作用）。网络邻近从有效的药物应该能够恢复被疾病解除调节的基因的健康表达的假设出发，具有最富集疾病相关基因的标签的药物也应该是治疗此类疾病的最有希望的药物为了获得这些知识，对LINCS的数据集（药物特征）进行了反向基因集富集分析[10]对于每个分析的数据集，分别计算归一化富集评分和p值（将富集评分与从100 000个排列生成的零分布的富集评分进行比较估计），以测量富集程度及其统计学显著性然后使用Benjamini-Hochberg程序[32]对所得p值进行多重比较校正，获得FDR。如果数据集显著富集（FDR 0.25），则认为相应药物是潜在候选药物。<网络分离研究药物组合的一个重要方面是评估两个药物-靶标模块在人蛋白质-蛋白质相互作用组上是重叠的（重叠暴露）还是分离的（互补暴露）[6]。在重叠暴露的情况下，化学、生物学、功能和临床特征具有较高的相似性。相反，所需的组合是那些具有完全暴露的组合，两种药物在拓扑学和药理学上是不同的。在后一种情况下，两种药物协同合作治疗疾病，但每种药物都有自己的方式。正如我们计算药物-疾病概率以及测量药物组合中的药物-药物分离率所做的那样，我们采用了基于网络的方法[6，45]：与特定疾病相关的蛋白质不太可能分散在整个相互作用物组中，相反，它们倾向于聚集在一起，��AB=��（三）所谓的疾病模块[45]。药物和疾病之间的关系可以通过无监督和无偏见的基于网络的方法来估计[4]，该方法量化了药物靶标和疾病相关基因之间的相互作用，测量了网络的接近度。在这里，我们使用了这种方法的最新修改版本[10]，其中包括一个项（），用于将药物靶点的程度直接考虑到距离计算中。已知疾病相关基因的集合其中，λ是药物靶标的集合;λ（λ，λ）是人类蛋白质-蛋白质相互作用组中节点λ（λ∈λ）和λ（λ∈λ）其中，λ是一种药物的靶模块，λ是另一种药物的靶模块。在这里，平均最短距离（用等式(1) 权重��固定为0）��与所有可能的A-B靶标对之间的平均最短距离（）进行比较。当计算A-B靶点对之间的距离时，如果一种蛋白质被两种药物靶向，则其距离根据定义为零。如果≥ 0，则认为药物联合暴露是互补 ��的，否则重叠。L. Menestrina和M. 雷卡纳蒂尼生命科学中的人工智能2（2022）1000424图二、丰富的生物过程。气泡图显示了与亨廷顿氏病的生物学过程相关的前20个最丰富的基因本体论术语(A)多发性硬化（B）在水平轴上，示出了褶皱富集。颜色对错误发现率对数的负数进行编码，size表示基因比率（计算为研究集中与特定术语相关的基因百分比除以相应百分比的比率在背景中，即，整个人类蛋白质组）。结果计算框架在这项研究中，我们自动化了图中所示的管道。1用于筛选可重复使用的候选药物并优先考虑其组合。为了运行，脚本只需要疾病名称、疾病相关基因和感兴趣的细胞系作为输入。该程序包括：收集、清理和组织源数据（疾病相关基因、药物、靶点、蛋白质相互作用、药物诱导的基因表达标记）;鉴定可再利用的候选药物，评估它们对疾病的接近性和它们对疾病相关基因表达的影响;基于它们的相对暴露和已知的相互作用筛选可能的药物组合。例程的输出是一组表格（制表符分隔的值文件）和图，记录中间和最终结果。与以前的相关工作[10，11]相比，由于整体研究和结果的组织和标准化，这种系统此外，它向前迈出了一步，因为它还评估了可能的联合治疗。在下文中介绍和讨论了将框架应用于HD和MS的单个步骤和结果。疾病相关基因的收集和验证我们收集了方法部分所述的疾病相关基因：这导致了451和217个与HD和MS相关的基因分别为了评估这些基因是否代表所研究的疾病，我们对GO和HPO项进行了富集分析。这使我们能够检查最丰富的生物过程、分子功能、细胞组分和表型是否与先前的知识一致。先前的研究将HD与转录、细胞内信号传导、细胞内转运、内吞再循环和线粒体的功能障碍相关[12]。该知识与我们发现富集的生物过程、细胞组分和分子功能一致（图2A和补充图1A、B）。这同样适用于表型，其与消极、社会和职业恶化、线粒体和神经问题相关（补充图1C）[12，15]。MS是一种自身免疫性疾病，其炎症因子含有T淋巴细胞和B细胞，并导致少突胶质细胞损伤和脱髓鞘[19]。这与我们分析中的丰富术语一致（图2B和补充图2）。获得的结果得到了文献的证实，这表明收集的基因代表了所研究的疾病。此外，如Menche等人[45]所述，疾病模块被测试为非随机基因聚集体。将疾病模块的最大连接组分的大小与通过从相互作用组随机挑选蛋白质（匹配疾病相关基因的数目）获得的组分的大小进行比较（比较显示在补充图3中）。对于这两种疾病，疾病模型的结果明显大于随机对应物，这使我们能够声明它们不能归因于基因的偶然聚集。L. Menestrina和M. 雷卡纳蒂尼生命科学中的人工智能2（2022）1000425图三. 距离分布。药物靶点和疾病相关蛋白质之间的距离分布（蓝色实线）与参考集合（橙色虚线）相比，亨廷顿病（A）和多发性硬化症（B）。在垂直轴上，示出了分布的核密度估计。该图被所选距离阈值分为两部分（绿线，参见方法）。可重复使用药物选择基于网络的接近性分析，利用系统视图的潜力，可以建议能够以非平凡的方式干扰疾病分子决定因素的有价值的药物（即，不仅直接靶向疾病相关基因）。这种方法背后的想法是，药物亲疾病模块应该更有效，如Guney等人在一项广泛的分析中所示，该分析考虑了已知疾病和疾病相关基因以及药物及其靶标[4]。根据Peng对于这两种疾病，有可能确定一个距离值，低于该距离值，两条密度曲线（药物和参照）急剧下降。特别是，参考密度假定低于该点的距离可以忽略不计（图3，图中绿色部分）。我们选择这样的距离值（图3，垂直绿线）作为区分与疾病相关的药物的阈值。这些距离分别为0.68和0.71（对应于近似值：-0.53和-0.98）。根据该分析，从DrugBank收集的5798种药物中，有685种（11.8%）被认为是HD的重要药物，475种（8.2%）被认为是MS的重要药物。为了评价药物对疾病的影响，我们检查了其给药对相关细胞系中疾病相关基因表达的影响（参见方法）。我们通过对896种药物进行反向基因集富集分析（IGSEA）来实现这一目标，这些药物在HD的6 212个LINCS表达数据集中观察到，在MS的5 579个数据集中观察到960种药物。显著富集和接近疾病的药物被认为是可重复利用的候选药物：138种用于HD，38种用于MS（补充表2，3）。MS相关基因、药物靶标和可再利用候选药物之间的相互作用在图4（以及HD的补充图4）中可视化，显示了药物如何通过其靶标与疾病相关。不幸的是，只有一小部分的亲药在LINCS数据库中有数据（HD为21.9%，MS为13.7%）。尽管IGSEA分析增加了结果的可靠性，但它大大减少了可以研究和可能提出的分子数量。在评价研究结果时必须考虑到这一点。为了对预测的可重复利用药物池更加自信，我们使用三种不同的相互作用组复制了整个过程。我们原来的一个和两个网络用于验证它的大小和列出的相互作用都不同（见方法）。尽管存在这些差异，但两种研究疾病的可重复使用药物组合结果相当一致。在HD的情况下，138种药物基于原始相互作用组被优先考虑，110种基于Cheng的相互作用组，133种基于我们限制的相互作用组。值得注意的是，从两个较小的相互作用组中检索到的所有分子都包括在第一个相互作用组中。对于MS，可以得出非常相似的结论，对于MS，程序预测了39种具有大相互作用组的药物，26种具有Cheng药物组合联合治疗和多靶点药物已被证明比单药治疗具有更显著的优势，具有更高的疗效和更少的不良反应[6，46]。然而，由于组合爆炸，通常不可能测试所有理论上可能的关联。出于这个原因，我们采用了Cheng等人[6]提出的最新方法，该方法基于对人蛋白质-蛋白质相互作用组上靶邻近区分离利用这一点，可以根据药物之间的药理学关系筛选所研究的组合（参见方法）。此外，我们还在DrugBank中查找了增加不良反应风险或严重程度的已批准关联和相互作用。通过这种方式，我们最终得到了补充表4和5中列出的各种合理组合，并且可以在图5的HD和MS的补充图5的注释热图中识别。讨论蛋白质-蛋白质相互作用组对于这两种疾病，使用三种相互作用组预测的可重复利用的药物库是合理的一致性。然而，重要的是，与在Cheng的相互作用组上的相同程序相比，在我们的相互作用组上执行流水线改善了预测，增加了7种药物，其中9种来自临床试验的证据，1种来自HD的体外实验，5种临床测试药物和1种这一结果似乎表明，在程序中注入更多的输入数据（仍然保持高可靠性标准）会导致L. Menestrina和M. 雷卡纳蒂尼生命科学中的人工智能2（2022）1000426见图4。多发性硬化症基因靶向药物网络。桑基图说明了疾病相关基因、药物靶点和药物之间的相互联系。每种药物（右栏）都与其报告的靶点（中栏）相连，而靶点又与人类相互作用组上的一些疾病相关蛋白质（左栏）相邻。药物由各自的ATC代码着色，IGSEA分析的FDR（见方法）报告在标签中性能提升，这完全符合大数据的观点[47]。可重复使用的药物在选择用于治疗HD的药物中（138），有几种（17）已经过临床试验和建议，许多药物显示出体内试验的有力证据（35）或体外试验的有希望的结果（9）。所有参考文献都在补充表2中报告，这是最值得注意的检查-[48][49][4已发现Selisistat安全、耐受性良好，并且能够达到与SirT1抑制相容的血浆浓度，这已显示在HD模型中恢复转录失调[48]。利磺脲能够诱导HD引起的运动功能亢进患者的运动表现出现暂时但显著的改善[49]。已证明丙戊酸是因肌阵挛性运动过度而导致HD患者的可能替代治疗[50]。维思通L. Menestrina和M. 雷卡纳蒂尼生命科学中的人工智能2（2022）1000427图五. 亨廷顿舞蹈症的治疗方法带注释的热图提供了有关所选药物的可能组合的信息。如果在DrugBank中报告了相互作用，则组合标记为×，如果存在于批准的制剂中，则标记为○。热图的左下部分显示了分离检查的药品，颜色编码从蓝色（无分离）到红色（强烈分离）。而右上角的部分则显示了曝光的类型：如果重叠，则显示紫色，如果互补，则显示绿色在最左边的部分，报告了药物的ATC代码及其层次聚类的树状图在治疗HD患者的精神症状和稳定运动症状方面具有有益效果[20]。检查筛选MS的药物（38），我们获得了相当的结果：其中7个进行了临床研究，9个在动物模型上进行了实验所有证据列于补充表3。最临床试验中的药物旨在缓解症状，而我们发现唯一能够减少复发的药物是艾司西酞普兰[51]有证据表明，它可能是一种有效且耐受性良好的治疗方法，可预防MS女性的压力相关复发[51]。L. Menestrina和M. 雷卡纳蒂尼生命科学中的人工智能2（2022）1000428在研究可重复利用药物的解剖学治疗学化学（ATC）代码除此之外，HD可再利用药物的最常见代码第一组主要是他汀类药物，用于应对HD患者典型的胆固醇损害[52]。免疫调节剂主要是免疫抑制剂和组蛋白脱乙酰酶抑制剂，后者旨在从神经系统疾病中常见的组蛋白低乙酰化中恢复[53]。而对于MS，第二个最常见的代码是L（抗肿瘤和免疫调节剂）。一些相关的例子是鲁索奥利替尼、紫杉醇、他莫昔芬和沙利度胺，它们能够减弱实验性自身免疫性脑脊髓炎并诱导髓鞘再生[54药物组合观察所获得的结果（在图1B中描绘为注释的热图）。 5用于HD和补充图5用于MS），有趣的是，强调没有ATC代码的药物也是很少（或根本没有）报告相互作用的药物。这表明，它们的特征并不充分，在进一步考虑之前需要对其进行额外的研究。收集到的合理组合有很多，但应强调奥芬那君（DB 01173）和卡那卡因（DB 00201）治疗HD的相关性。这些分子与乙酰水杨酸（ASA）一起存在于FDA批准的用于缓解肌肉疼痛的制剂中。这种药物值得注意的原因有很多。首先，疼痛是HD的已知问题，可能是一种重要的非运动症状[59，60]，因此，不应忽视其治疗。此外，奥芬那君还可有效预防具有类似HD组织学和神经化学特征的化学诱导条件的大鼠的神经毒性[61]。此外，低剂量的可卡因在HD动物模型中显示出有益[62]。最后，ASA被包括在制剂中用于缓解疼痛和减少肿胀。尽管ASA对HD有促进作用，但它未被纳入我们的结果中，因为其数据在LINCS中不可用。然而，它实际上是有益的，因为它显示出防止蛋白质聚集在几个神经变性，见图6。艾司西酞普兰和托法替尼复方制剂-EschitalopramandTofacitinibComple-Eschitalopram x ESCHITALOPRAM.该网络显示了与MS相关的蛋白质（圆圈）和突出显示的艾司西酞普兰和托法替尼靶向的蛋白质（分别为深绿色和深蓝色）。与MS不相关的靶标被指示为三角形。为了更好地说明蛋白质组紧密互连所产生的这两种分子的影响，药物靶点的第一个相邻物用较浅的颜色表示（艾司西酞普兰靶点的相邻物为浅绿色，托法替尼靶点的相邻物为浅蓝色）。L. Menestrina和M. 雷卡纳蒂尼生命科学中的人工智能2（2022）1000429传染病[63]。需要进一步评估，但这可能是一个值得关注的起点。治疗MS的合理假设可能是作为艾司西酞普兰（DB 01175）和托法替尼（DB 08895）或鲁克斯奥利替尼（DB 08877）的两种药物彼此成功分离，能够消除疾病模块的互补部分图图6显示了与MS相关的蛋白质之间的相互作用网络（所有循环），并突出显示了艾司西酞普兰和托法替尼靶向的蛋白质（分别为深绿色和深蓝色）。在这些靶点中，其中两个，即艾司西酞普兰的HRH 1（深绿色圆圈）和托法替尼的TYK 2（深蓝色圆圈），属于MS疾病模块，而与MS不直接相关的靶点用三角形表示（保持相同的颜色编码）。为了更好地说明这两种药物在蛋白质-蛋白质相互作用方面对疾病模块的影响，药物靶标的第一个相邻物颜色较浅（艾司西酞普兰靶标的相邻物为浅绿色，托法替尼靶标的相邻物为浅蓝色）。可以看出，总体而言，艾司西酞普兰和托法替尼或其第一个邻居的靶标可以在不冗余干扰相同MS蛋白的情况下干扰疾病模块的合理部分事实上，我们的分析表明，这些药物对MS有促进作用，并显著影响与这种疾病相关的蛋白质。此外，DrugBank中未报告它们之间的相互作用此外，我们发现了支持这一推论的实验证据。艾司西酞普兰是一种选择性5-羟色胺再摄取抑制剂（ATC代码：N，Nervous），在人类中被证明可以预防压力相关的复发[51]。托法替尼和鲁索替尼在动物模型中显示出有希望的效果：第一种增强髓鞘再生和改善髓鞘完整性[64]，第二种改善疾病的严重程度[54]。此外，它们是Janus激酶（JAK）抑制剂（ATC代码：L，抗肿瘤和免疫调节剂），并且JAK/STAT途径在MS中被异常激活[21，65]。在其他药物组合中，这些药物被充分分离（见方法，热图上的绿色），并且没有报告不良相互作用（热图中没有用×注释），可以找到多药物干预的有价值的线索。一个工作假设可能是选择两种药物来处理疾病的不同方面，例如具有不同的ATC代码。限制尽管我们做了最好的努力，但这项研究也不能免除一些在数据分析中常见的缺点，主要考虑数据的可用性和质量。这可能会导致我们错过一些有前途的化合物，同时，它可能会损害一些分析。目前肯定还没有对所有可用药物和人蛋白质进行完整表征，这对研究的许多方面都有影响，例如，人类蛋白质-蛋白质相互作用组结构、药物与生物学过程、细胞组分、分子功能和表型的关联以及药物诱导的基因表达有助于恢复。只有在某些情况下，通过广泛整合来自各种数据库的数据，才能部分缓解这一问题值得注意的，令人困惑的例子可能是药物-靶点关联和LINCS中表达数据的可用性。与特定药物相关的靶点数量可能在很大程度上取决于对这种药物的研究，而不是对它实际的生物学相互作用的研究。这有助于药物-疾病亲合性评价。此外，如上所述，LINCS数据库并不提供通过网络亲合性选择的所有药物的表达谱，这限制了药物再利用的选择空间此外，如果说我们对毒品的知识是不完整的，那么我们对毒品的组合的知识就更少了。显然，这影响了我们筛选和判断合理关联的能力此外，可以认为，即使用严格的几何方法评估药物-疾病亲合性，我们用来区分毒品的距离阈值是相当自由裁量的。结论在这里，我们扩展了一个无监督的计算框架，药物再利用与基于网络的分析，筛选可能的药物组合疗法。将这一管道应用于HD和MS，我们确定了几种可重复利用的候选药物，其中一些已经在人类中进行了研究。最终，我们最终得到了138种治疗HD的潜在药物和38种治疗MS的潜在药物。虽然这些结果是探索性的，在进一步考虑之前应该进行实验验证，但它们可以为改善HD和MS的管理提供有价值的线索。最后，该管道证明对两种研究性疾病有效，尽管它们具有不同的性质。由于这个原因，它也可能为其他复杂疾病提供新的建议。数据和代码可用性最相关的结果包含在本文（及其补充信息文件）中。整个生成的数据都可以从GitHub存储库https://github.com/LucaMenestrina/UnsupervisedComputationalFrameworkForDrugRepurposing中公开获得，以及收集，构建和分析的完整代码。源数据的详细参考资料载于文件 “data/sources/sources” 。json“（报告每个数据库的名称、版本、许可证、使用的文件、URL和访问日期）。竞争利益作者声明没有竞争利益。资金这项研究没有得到任何公共、商业或非营利部门资助机构的特别资助。补充材料与本文有关的补充材料可在在线版本中找到，网址： doi ：j.ailsci.2022.100042。引用[1] Pushpakom S，Iorio F，Eyers PA，et al. Drug Repurposing：Progress，ChallengesandRecommendations.NatRevDrugDiscov2018;18 ： 41-58.doi：10.1038/nrd.2018.168。[2] Talevi A，Bellera CL.药物再利用的挑战和机遇：寻找替代疗法的策略。Expert OpinDrug Discov 2020;15：397doi：10.1080/17460441.2020.1704729。[3] Choudhury C，Arul Murugan N，Priyakumar UD.基于结构的药物再利用-ing ：传统和先进的 AI/ML 辅助方法。 2022 年的药物发现。 doi ：10.1016/j.drudis.2022.03.006。[4] Guney E，Menche J，Vidal M，Barábasi AL.基于网络的计算机药物疗效筛选。NatCommun 2016;7：10331. doi：10.1038/ncomms10331。[5] 郑F，Desai RJ，Handy DE，等。基于网络的预测方法和基于人群的计算机药物再利用验证。 Nat Commun 2018;9 ： 2691. doi ：10.1038/s41467-018-05116-5。[6] Cheng F ， Kovács IA ， Barabási AL. 基于网络的药物组合预测。 Nat Commun2019;10：1197. d o i ：10.1038/s41467-019-09186-X。[7] Cheng F，Lu W，Liu C，et al. A genome-wide positioning systems net-用于计算机药物再利用的工作算法。 Nat Commun 2019;10 ： 3476. doi ：10.1038/s41467-019-10744-6。[8] Zhou Y，Hou Y，Shen J，et al.一种网络医学方法，用于COVID-19疾病表现和药物再利用的调查和基于人群的验证。 PLOS Biol 2020;18 ： e3000970. do i ：10.1371/JOURNAL.PBIO.3000970。[9] 方军，张萍，周燕，等。基于内表型的计算机网络医学发现与保险记录数据挖掘相结合，将西地那非确定为阿尔茨海默病的候选药物。Nat Aging 2021;1：1175-88. doi：10.1038/s43587-021-00138-z。L. Menestrina和M. 雷卡纳蒂尼生命科学中的人工智能2（2022）10004210[10] Peng Y ，Yuan M ，Xin J，Liu X ， Wang J. Screening novel drug candidates forAlzheimer'sdiseasebyanintegratednetworkandtranscriptomeanalysis.Bioinformatics 2020;36：4626-32. doi ：10.1093/bioinformatics/btaa563.[11]Quan P ， Wang K ， Yan S ， et al. Integrated network analysis identifyingpotential novel drug candidates and targets for Parkinson's disease. Sci Rep2021;11：13154.doi：10.1038/s41598-021-92701-2。[12] Bates GP，Dorsey R，Gusella JF，et al. Huntington disease.Nat Rev Dis Prim2015;1：15005. doi：10.1038/nrdp.2015.5。[13] Loscalzo J，Kohane I，Barabasi AL.后基因组时代的人类疾病分类：人类病理学的复杂系统方法。Mol Syst Biol 2007;3：124. doi：10.1038/MSB 4100163。[14] Wright GEB，Black HF，Collins JA，et al. Interrupting sequence variants and ageof onset in Huntington's disease：clinical implications and emerging therapies.《柳叶刀·神经病学》2020;19：930-9。doi ：10.1016/S1474-4422（20）30343-4。[15] Finkbeiner S，亨廷顿氏病。冷泉港透视生物学2011;3：a007476。doi：10.1101/cshpers.a007476。[16] Kobelt G，Thompson A，Berg J，Gannedahl M，Eriksson J.欧洲多发性硬化症负担和成本的新

下载后可阅读完整内容，剩余1页未读，立即下载