抗高血压药物的突出模式：三层无监督学习方法

164 浏览量更新于2024-01-07 收藏 1.02MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

¼¼¼��医学信息学解锁19（2020）100303聚类分析识别抗高血压药物的突出模式：一种三层无监督学习方法瑞图·夏尔马CSIR-印度化学技术研究所分子建模中心，Tarnaka，海得拉巴，印度A R T I C L EI N FO保留字：高血压抗高血压药物数据科学聚类A B S T R A C T聚类将具有相似模式的分子聚集在一起，并且主要由结构特征（SF）控制。所面临的挑战是以这样一种方式进行聚类，即最少数量的具有相似流行模式的重要分子的组在最少的人为干预下聚集在一起。确定一种自动和可靠的方法来簇分子是至关重要的医疗条件的临床评估。高血压是一种常见的健康问题，抗高血压药物是治疗高血压的有效药物。主成分分析（PCA）和k-means是成熟的独立算法，然而，在这项工作中，聚类是通过PCA进行的，然后进行单向相似性分析（ANOSIM）。统计相关性的附加步骤在聚类的最终选择中带来了新颖性。后者突出了两个或多个组之间的显著差异，以基于组内特征的相似性来增强聚类。将美国食品和药物管理局批准的抗高血压药物聚类为6组，显示成功率为94.73%。k6的Kruskal-Wallis检验表明样本中位数之间存在显著差异。对聚类的分析确定了组内的突出模式。K6的平均特异性和敏感性为98.01.6%和97.34.5%。的简要概述讨论了k 6的PCA图中重叠分子的结构或功能相关性。这项研究可能是有用的初步评估，以确定流行的趋势，在SF的AH。1. 介绍一般来说，药物往往有助于改善公众健康。这些化学物质通过与靶点相互作用来增强或抑制生物功能，从而治愈疾病或缓解症状[1]。化合物的结构复杂性通常与其靶点的特异性相关，并归因于其所具有的结构特征（SF）[2]。聚类是基于相似SF对分子进行分组以识别模式的先决条件。SF的选择和聚类的形成是最具挑战性的问题之一，可能导致有偏见的结果或过拟合。因此，迫切需要有一种方法，以最少的人为干预成功地聚集分子[3]。特定于健康问题的模式和共性可以在功能水平上揭示分子机制[4]。高血压（hypertension，HTN）是全球常见的危险性疾病之一健康问题。由于近几十年来生活方式的变化，卫生部门需要明确关注的最大挑战[5]。多种抗高血压药（AH）用于治疗患者。之间他们，一几是作为遵循; 利血平[6]和贝塞尼丁[7]是降低血压的一线疗法。硝普钠和硝酸甘油是无环分子;作为血管扩张剂的前体[8]。硝苯地平是一种硝基芳香族化合物，可防止血管收缩所需的钙的影响[9]。与硝苯地平和非洛地平相似，伊拉地平也是一种联苯衍生物，可作为钙通道阻滞剂[10]。马昔腾坦是一种卤代嘧啶，可用于治疗肺动脉高压[11]。拉西地平是一种二氢吡啶衍生物，可减弱TNF-α诱导的心肌细胞凋亡和焦虑样症状[12，13]。结构指导分子的作用，因此识别特权支架的模式可以帮助初步评估药物疗效以及毒性[14，15]。支架的中心组成部分是分子拥有的环系统[16，17]。Shang等人，2017年通过迭代去除环对支架进行了分级分类[18]。基于环的模式的重要性可以由最近的调查表明。确定基于环的结构模式的偏好可以帮助分子设计以实现特定功能[17，19例如;喹啉，一种多功能杂环稠环支架在癌症药物中很常见[19]。电子邮件地址：sharmar@tech-center.com，reetush01@gmail.com。https://doi.org/10.1016/j.imu.2020.100303接收日期：2019年12月26日;接收日期：2020年2月15日;接受日期：2020年2月15日2020年2月21日在线提供2352-9148/©2020的作者所有发表通过Elsevier 公司这是一个开放接入文章下的CCBY-NC-ND许可证（http://creativecommons.org/licenses/by-nc-nd/4.0/）中找到。可在ScienceDirect上获得目录列表医学信息学期刊主页：http://www.elsevier.com/locate/imuR. Sharma医学信息学解锁19（2020）1003032杂环胆碱类似物是具有抗癌和抗感染双重作用的特殊支架[20]。二氢吡啶异构体是具有治疗作用的杂环[21]，并且是钙调节分子[25]。到目前为止，已经提出了几种鉴定类似分子的分析[26]。其中一种方法采用结构指纹[27，28]或公开可用的电子记录上的分子片段[29]，第二种方法包括代表化学空间探索结构的支架识别[1]。遵循定义药物相似性的规则的数据集的理化性质的分析是基于化学信息学的方法的焦点[1]。一些计算研究提出了结构改变来预测分子的生物学作用，但其可靠性值得怀疑[15，30，31]。受机器学习成功的激励在药物开发[32]和医学[33]中，研究人员正在研究聚类分析，以使用主成分分析（PCA）和k-means [34，35]的组合来识别疾病特定模式和共同性。然而，基于SF的药物聚类是有限的，并且相对未暴露，因此需要全面调查。在这里，我们尝试对AH进行聚类，以确定Promi-使用三层无监督的机器学习方法来识别新模式。基于环系的特征的指纹表示以矩阵形式编码，以最小化维数。PCA和k-means之后是统计相关性检查。单向相似性分析（ANOSIM）的另一个步骤[36]，统计方法在聚类的最终选择中带来了严格性。基于环系统的类型将AH聚类为六个组。对AH的分析揭示了每个群体的突出模式。据我们所知，这是第一次尝试使用无监督学习方法对疾病进行药物聚类。这项工作的关键发现是，组合允许成功的自动聚类，基于SF的药物，需要最小的人为干扰来突出趋势。该研究有望对潜在的AH模式识别的初步评估有所帮助。2. 材料和方法在本节中，图1中示出了对AH进行聚类所采用的方案。1.一、详情见下文各小节。2.1. 数据挖掘和特征提取在DrugBank（v5.1.2）[37]中系统检索了美国食品药品监督管理局（FDA）于2018年12月批准的AH。该数据集由从DrugBank获得的114个AH组成。这些分子是在临床试验、实验、研究或停药阶段去除药物后提取的。本研究考虑的AH详情见表S1。检索描述每种AH的数据，并提取简化分子输入行输入系统（SMILES）格式中所需药物的结构信息[38]。它是结构化语言和信息系统之一，由Weininger提出[39]。硝基基团被标准化，并且在提取环系统的类型之前从数据中去除盐。不同的环类型，即，从PaDEL（v2.4）[40]中提取AH的元数、稠合数和杂原子（N、O、S、P、F、Cl、Br、X）的存在，并编码为指纹表示，以获得包含基于环的SF的矩阵（图2）。表S2a、S2b和S2c中列出了基于环系统类型的68个SF。表S3提供了研究考虑的每个SF的描述。Fig. 1. 概述了采用集群的AH的方案。第1层、第2层和第3层步骤分别为蓝色、橙色和绿色背景。(For对本图中颜色图例的解释，读者可参考本文的网络版R. Sharma医学信息学解锁19（2020）1003033n2⋮ ⋮⋯3⋮冠状病毒AAn;n¼-2�P于我��64图二. 初始特征矩阵的推导。示例是指示基于环的指纹表示的类型的虚拟分子。环是颜色编码的，突出显示每个图案的特征向量。(For关于本图图例中颜色的解释，请读者参阅本文）。2.2. 选择特征k n数据维度的减少在突出SF基于数据中的患病率的贡献方面起着重要作用。PCA第1页1/1已被广泛用于探索高维大数据集，并在减少数据集的维度方面发挥关键作用[41]。在上述子部分中提取的特征是矩阵形式（L），其中矩阵中的每列表示特征的数值，每行示出每个受试者的特征（图1）。 2）的情况。通过以下公式计算n个样本中两个变量A1和A2数据集的协方差（Cov冠状病毒A1;A2冠状病毒A1冠状病毒-A1冠状病毒A2冠状病毒-A2冠状病毒其中k是要形成的聚类数，n是样本大小，Ai是情况I，cj是每个聚类j的质心迭代地，分配待形成的簇的后续数量，并且将数据分组，直到基于新的质心值报告簇之间的距离相似。2.4. 统计分析使用R软件包（v3.2.3，-i¼1http://www.r-project.org/）或PAST（v3.21）[43]。为了测量CovA1;A1CovA1;A2...C <$Cov A 2 ;A1冠状病毒A2;A2病毒冠状病毒An;A1CovAn;A2.冠状病毒A1;冠状病毒A2;冠状病毒75使用皮尔逊相关系数（Pearson's r）计算相关的数值特征，这是一个广泛使用的确定相关性的参数，由下式给出：r<$Pixi-xyi-y特征值和特征向量由C.的特征值提取相应的特征向量。PC对应于协方差矩阵X的相应特征向量，并且以降序排列。每个PC是分配给不同SF的不同权重的组合。2.3. 主题聚类将捕获大部分特征变化的PC用于k均值聚类。分配初始随机聚类数（k）。例如，四个集群（k 4）被命令从前五个PC和数据被分成四组。初始化每个聚类的质心值，并基于欧几里得距离定义最近聚类数据点之间的距离[42]。qffiPffifififfiffiiiffixffiffiiffi-ffifififfiffixffiffiii-ffiffi2ffiffiyffiffiiiffi-ffi ffififfiffiyffiffi2ffiffi其中x和y是变量。1到1是指相关范围。ANOSIM [36]，一种统计检验对排序的相异性指数进行操作，并表示为BOX图。ANOSIM被广泛用于检验是否可以拒绝零假设，即组之间的相似性大于或等于组内的相似性。利用9999的排列（N）和基于欧几里得距离的相似性指数，ANOSIM静态（R值）和显著性（p<0.05）由下式给出：R¼rBS-rw其中rB是组之间AH的SF的秩相似性的平均值（bw），并且rw是组内的秩相似性的平均值。S<$n<$n-1 <$n=2，n为样本数。轻度离群值为R. Sharma医学信息学解锁19（2020）1003034þþtnfpTP-2000þ¼¼¼¼¼¼¼ ¼¼þðnþ-2019年01月11日 nz超出第一四分位数（Q1）- 1.5 * 四分位数间距（IQR）和第三四分位数（Q3）1.5 * IQR的数据点，但不是极端离群值。EX treme离群值是比Q1更极端的数据点- 3 * IQR或Q3 3 * IQR。轻度和极端离群值在BOX图上用圆圈（O）和星号（*）Kruskal-Wallis检验[44]，一种额外的非参数统计检验，比较两个或多个不同或相等大小的独立组，以确定它们是否不同。测试静态（H）的E表达式如下：被移除了nTR和nFHR被切掉，因为没有添加新信息。n5R、n6R、nF9R、nF10R、n5HR和n6HR之间的相关性表明，五元环比六元环具有更高的杂环倾向。X元环更倾向于与另一个X元环稠合，而五元环一般倾向于保持未稠合的形式（图3）。这表明，尽管有许多可能性，但只有少数SF关联是可能的。e23.2. 选择最后的集群H. ×2121XRz-31其中e是组的数量，nz是第z个组的大小，Rz是第z个组的秩和，n是总样本大小。特异性和敏感性是评估正确聚类性能的统计度量。特异性涉及测试正确地将不遵守模式的AH聚类到另一组的能力。专属性¼tn灵敏度是指测试灵敏度¼tp真阳性（tp）：AH服从组X的模式，并被正确地放置到组X中;假阳性（fp）：AH不服从组X的模式，但被错误地放置到组X中;真阴性（tn）：AH不服从组X的模式，并被正确地放置到另一个组而不是x中;假阴性（fn）：AH服从属于组X的模式，但被错误地放置到另一个组而不是x中。已报告平均特异性和特异性及标准差（SD）。3. 结果3.1. SF之间的相关性所选SF之间的统计学关系由Pearson r确定（图1）。 3）。在68个SF中，没有显示出差异的那些PC提取系统的全部方差（~100%;表S4），并将AH聚类（k 4至k 10）到不同的组中（图4;表S5）。ANOSIM检验的结果R值接近1，表明各组之间的差异。图S1指示相应数目的聚类的R值，并且示出在k 6、7、10处的0.84的迭代R值。从k 6到k 7的转换增加了组内离群值的数量。迭代R值（0.84）和k内离群值的最小数量（6）第六条规定，分成六组k 6的附加统计检验（Kruskal-Wallis检验）的H（χ2）值为9.91。当H> 5.99且p <0.05时，这表明样本间存在显著差异99%）仅具有六元环，大多数由两个或三个六元环组成（图S4）。与g1相反，分子的尺寸相对较小，近四分之三的分子只有两个环。这两个环是六元环体系.最大数量的AH属于g2。环戊噻嗪（DB 03532）由五元环组成，因此是g2的fn。第3组（g3）中的分子在大小上也与g2相似。与g2不同，g3分子至少有一个五元环（图S5）。近三分之二的g3分子由两个环组成，其中一个是五个环，另一是一六元戒指拉米替尼（DB00178），依普罗沙坦图三. 基于环系统的AH的所选SF之间的相关性。椭圆的面积表示SF之间的关系的强度。SF的详细信息见表S3。Pearson's r的范围如果p> 0.05，则相关性的显著性（用p表示）交叉。(For对本图中颜色图例的解释，读者可参考本文的网络版（DB 00876）、卡托普利（DB 01197）和利美尼定（DB 11738）不遵循g3的模式（表1），因此是该组的fps与g1类似，第4族（g4）分子的尺寸也很大。然而，与g4相反，g1分子具有杂环五元环。他达拉非（DB 00820）是一种不符合图S6所列分组模式的fp。另一方面，它是g1的fn，因为它遵循g1的模式。g1和g4的BoX图（图4c）相对高于其余组内，表明SF相对差异的发生率。大多数第5（g5）族分子（>85%）是由两个六元环系统组成的三元环系统，并且环优选是五元环（图S7）。环噻嗪（DB 00606）和卡维地洛（DB01136）为fps，因为含有四个环的分子偏离表1中列出的g5模式。单环分子是第6（g6）族的特征（图1）。 S8）。组中有三个fps;两个PC1和PC2捕获了近90%的数据变化前五R. Sharma医学信息学解锁19（2020）1003035¼ ¼ ¼¼¼ ¼¼¼¼见图4。基于分配的聚类数（ k ），用组（bw）和组数（x轴）之间的相异性等级指数（ y 轴）绘制聚类 AH 的 Bo x 图表示。(a)、（b）、（c）、（d）、（e）、（f）和（g）是a）k的组间和组内排序相似性（ANOSIM分析）的BOX图4，b）k5，c）k6，d）k 7，e）k 8，f）k 9，和g）k 10。BW是指组间。轻度和极端异常值分别用空心圆和星号标记。离群值的定义是材料和方法部分。表1k的各组显著模式6. SF的描述见表S3。表2各组对k1/4 6的特异性和敏感性试验（%）3G3（2n5R�X 3n5R）<（2n6R�X� 3n6R）(n5R[n7R）n5R 24 214G4（X¼2 nR）\nR12 115G5（4 nR�X� 6 nR）\（n6R<1.4）（X¼3 nR）\2n6R\(1n5R[1n7R）14 12值）为0.02 s。观察到的流行聚类算法的计算时间，如简单的k-均值，基于密度的空间聚类的应用程序与噪声（DBSCAN）和层次6g6X¼ 1nR 24 21其中一种没有环（硝普钠（DB 00325）;硝酸甘油（DB 00727）），另一种由两个环组成（倍他洛尔（ DB 00195 ））。 Captopril （ DB01197）是g6的fn;位于g3中的单环分子。各组k中AH的百分比分布6是在表1和图。 S2. 图2的g2、g3、g5和g6的box图。 4C是表3选择性聚类算法的比较。表1中报告了所应用方法（PCA：k均值：ANOSIM）的聚类实例。S. 号聚类算法1.DBSCAN 0 52（46%）相对较短，这表明组内的AH彼此之间有很高的一致性。2.层次聚类1 62人（54%）0 113（99%）101人（1%）在这项研究中，对于Intel（R）Core（TM）2 Duo CPU和安装的2.00 GB内存（RAM），一个周期的计算时间（确定k-3.简单k均值0 46（40%）1 68（60%）S. 号组号特异性（%）灵敏度（%）1G110088.82G298.8100.03G395.7100.04G499.0100.05G598.0100.06G696.795.4平均值�SD98.0 �1.697.3 �4.5S.号组号图案分子数量聚类分析（%）1G1（4 nR× 6 nR）\0872G2（2 nR× 3 nR）\3228R. Sharma医学信息学解锁19（2020）1003036¼¼¼þþ表3中列出的聚类对于一个循环也在~ 0-0.03秒的范围内4. 讨论4.1. 从最终选择中在本节中，我们讨论在PCA图中占据相似位置的选择性AH，从而在k6的组中重叠（图S9）。属于g1的奥美沙坦（DB 00275）和氯沙坦（DB 00678）是异构体，具有两个五元杂环的联苯衍生物（图S3）。它们的功能相似，因为两者都是血管紧张素II受体阻滞剂。两者都与G蛋白一起介导其功能.g2的普萘洛尔（DB00571）和纳多洛尔（DB01203）由稠合六元环组成，是非选择性β受体阻滞剂。它们执行的共同功能是蛋白质同源二聚化和受体信号蛋白活性。碳酸酐酶1和2是重氮氧化物（DB 01119）和氯噻嗪（DB 00880）的常见靶标。这些分子是具有1，2，4-苯并噻二嗪环系，在1-位上有两个S-OHydro-氯噻嗪（DB 00999）和氯噻嗪（DB 00880）具有直接母体（1，2，4-苯并噻二嗪-1，1-二氧化物），具有共同的靶点，溶质载体家族12成员3。Labetol（DB 00598）是一种治疗高血压的常用处方药，通常被认为在妊娠期间是安全的，与酚苄明（DB 00925）具有相同的尺寸（图S9）。两者都能对抗导致肌肉松弛的肾上腺素能受体。喹那普利（DB00881）和莫昔洛韦（DB 00691）是β-氨基酸酯，靶向血管紧张素转换酶。在g3中，依普罗沙坦（DB 00876）和螺环内酯（DB 01348）由两个五元环和一个六元环组成。两者的靶点都是血管紧张素相关酶。属于g3的培哚普利（DB00790）和吲哚洛尔（DB00960）是吲哚衍生物，是通道阻滞剂。噻吗洛尔（DB 00373）和莫索尼定（DB 09242）由两个环组成，一个五元环和六元环系统。两者都是针对肾上腺素受体。在g4中，rescinnamine（DB01180）、利血平（DB00206）和deserpidine（DB01089）具有相似的直接母体育亨宾生物碱。这些是含有通过在柯楠酰巯基乙胺前体中形成C-17至C-18键而产生的五环的生物碱。哌唑嗪（DB 00457）和特拉唑嗪（DB 01162）的直接母体是芳基哌嗪。两者均为喹唑啉衍生物，作用于β-1A肾上腺素能受体、β-1B肾上腺素能受体、β-1D肾上腺素能受体和钾电压门控通道亚家族H成员2。Fenoldopam （DB00800），尔硫（DB00343）和贝那普利（DB00542）是苯并氮杂卓类的衍生物，然而，具有不同的靶点来实现抗高血压的功能。吲达帕胺（DB 00808）和氯噻酮（DB 00310）是苯磺酰基化合物，与溶质载体家族成员相互作用。在g6中，硝普钠（DB00325）和硝酸甘油（DB 00727）是与心房利钠肽受体1相互作用的无环血管扩张剂。甲酪氨酸（DB 00765）和甲基多巴（DB 00968）分别是以酪氨酸3-单氧化酶和芳香族氨基酸脱羧酶为靶点的苯丙酸衍生物。这一小节表明，具有特定SF的分子是接近的，甚至在一组中重叠（PCA图），并且通常实现相关功能。4.2. 方法的选择性比较特征选择是突出的，需要解决简化模型以便于解释，提高准确性，并通过减少过拟合来增强泛化。过滤器和包装器技术是最近流行的选择重要特征的方法[45]。虽然滤波方法在计算时间上是有效的，并且对过拟合是鲁棒的，但是这些方法抑制了最不感兴趣的变量并且仅与要预测的变量相关。与前者不同，包装方法检测可能的变量之间的相互作用，但这些方法的缺点是增加过拟合的风险时，实例的数量是不够的。虽然当变量数量很大时，包装器方法需要很长的计算时间，但是，后者不是这里的情况。与包装器方法相比，过滤器方法独立于机器学习算法。相关性（一种过滤方法）确定所选变量之间的关联，在PCA之前执行有助于减少过拟合。表3中报告了简单k均值、DBSCAN和分层聚类等聚类算法之间的比较。DBSCAN和k-means方法将近似相等数量的分子聚类为两组，但分层聚类将大多数分子分配在一组中。DBSCAN基于低或高点密度将分子分组在一起[46]。与DBSCAN相比，层次聚类涉及构建聚类的层次结构[47]。k-means是一种流行的聚类方法，然而，它的局限性之一是选择聚类（k值），并且通常是随机的。聚类确定中的模糊尝试经常导致将相似的突出模式放在一起的不准确性。为了解决这个问题，已经确定了不同范围的聚类（k 4到k 10），然后进行统计检查。最终选择是在选择最小k值时进行的，该最小k值导致代表图案的大量分子，在这种情况下，该图案具有初始饱和R值（ANOSIM）和组内的最小离群值。除此之外，还提出了对k-means算法的一些改进，如k-means算法， [47][48]和K-中心点[49]。前辅助选择k均值聚类的初始值，而后者对离群值更鲁棒，因为它最小化了成对差异的总和。该方法的成功可以通过可接受的正确聚类率、特异性和敏感性来评价。由于呈现的结果取决于k值，因此k值对于不同的数据集可能不同，然而，该方法应该基本上适用于聚类其他疾病药物。5. 结论本文报告了一个系统的尝试，聚类的AH到最小数量的显着组，以确定每个组的突出模式。在这项研究中，结合维数减少的容易性和数据驱动的计算权重赋予SF的优势，然后进行统计相关性检查以选择最终的聚类。根据环系的数量和类型，将AH分为六组。虽然这是一个初步的估计，在一个群体内的特定模式的偏好进行了观察。总体分析表明，尽管有许多可能性表明抗高血压药物的选定结构特征具有偏好性，但仅观察到有限数量和类型的环系统组合。作者贡献RS构思、设计、执行、分析和起草手稿。伦理声明没有人申报。竞合利益作者声明，他们没有已知的可能影响本文所报告工作R. Sharma医学信息学解锁19（2020）1003037þþ确认RS感谢新德里生物技术-BioCARe部门通过DBT赠款提供的财政援助（BT/PR 18249/BIC/101/390/ 2016）。IICT/Pubs./ 2019/339.资助者在研究设计、数据收集和分析、出版决定或手稿准备方面没有任何作用。附录A. 补充数据本文的补充数据可在 https ： //doi 网站上找到。org/10.1016/j.imu.2020.100303。引用[1] 李平斯基，霍普金斯.为生物学和医学导航化学空间。Nature2004;432（7019）：855-61.[2] ClemonsPA，WilsonJA，Da ncíkV，MullerS，CarrinskiHA，WagnerBK，KoehlerAN，Schreiber SL.对包含小分子筛选集合的小分子集合的结构和性能多样性进行量化。Proc Natl Acad SciUSA 2011;108（17）：6817-22.[3] 田口勇，岩馆M，梅山H.基于主成分分析的无监督特征提取应用于创伤后应激障碍介导的心脏病的计算机药物发现。BMC Bioinf2015;16（1）：139.[4] Chuenchor W，Jin T，Ravilious G，Xiao TS.模式识别受体的结构揭示了自抑制、配体识别和寡聚化的分子机制。Curr Opin Immunol2014：14-20.[5] 杨伟，王伟. 全球高血压负担：全球数据分析。柳叶刀2005;365（9455）：217-23。[6] Shamon SD，Perez MI.利血平对原发性高血压的降压疗效。 Cochrane DatabaseSyst Rev 2016;（12）。[7] LeishmanAW，Thirkettle JL，Allen BR. 贝塞尼定治疗高血压。英国医学杂志1968;1（5584）：120。[8] Archer SL，Huang JM，Hampl V，Nelson DP，Shultz PJ，Weir EK.一氧化氮和cGMP通过cGMP依赖性蛋白激酶激活钙离子敏感性钾通道引起血管舒张。ProcNatl Acad Sci USA1994;91（16）：7583-7.[9] Murphy MB，Scriven AJ，Dollery CT.硝苯地平治疗高血压的作用。英国医学杂志1983;287（6387）：257。[10] 王庆明，徐燕燕，刘松，马志国.伊拉地平通过抑制小鼠黑质L型钙通道上调和铁蓄积减轻MPTP诱导的多巴胺神经元变性。Oncotarget 2017;8（29）：47284-95。[11] [10]张文辉，张文辉.关注马昔腾坦治疗肺动脉高压。基础临床药理学与药理学2018;123（2）：103-13。[12] WangQ-L，Zhao L，Feng N，Zhou P，Wu Q，Fan R，Li J，Zhang S-M，Wang Y-M，Xu X-Z，et al. 拉西地平减轻TNF-α诱导的心肌细胞凋亡细胞因子2015;71（1）：60-5.[13] Khurana K，Bansal N.拉西地平减轻咖啡因诱导的小鼠焦虑样症状：钙诱导的氧亚硝化应激的作用。药理学报告2019;71（6）：1264-72。[14] Welsch ME，Snyder SA，Stockwell BR.用于文库设计和药物发现的生物支架。Curr Opin Chem Biol 2010;14（3）：347-61.[15] LimbanC ， NutaDC ， ChiritaC ， NegreplantsS ， ArseneAL ， GoumenouM ，KarakitsiosSP，Tsatsakis AM，Sarigiannis DA.使用结构警报来避免药物的毒性.至X icol Rep 2018;5：943-53。[16] Bohl M，Loeprecht B，Wendt B，Heritage T，Richmond NJ，Willett P.无监督3D环模板搜索作为支架跳跃的想法生成器：使用LAMDA，RigFit和基于字段的相似性搜索（FBSS）方法。J Chem InfModel 2006;46（5）：1882-90.[17] PollockSN，Cyneas EA，Wester MJ. Oprea TI：scaffold topologies I：exhaustiveenumeration up to 8 rings. J Chem Inf Model 2008;48（7）：1304-10.[18] 尚杰，孙华，刘华，陈芳，田S，潘平，李东，孔东，侯涛。复合文库结构特征及支架多样性的比较分析。J Cheminf 2017;9（1）：25.[19] 所罗门VR，李H.喹啉作为癌症药物发现的特权支架。Curr Med Chem 2011;18（10）：1488[20] 张文龙，张文龙. 基于1，2，3，4-四氢（异）喹啉的N-杂环胆碱类似物具有抗癌和抗感染双重作用的支架。药理学报告2017;69（3）：575-81。[21] Mishra AP，Bajpai A，Rai AK. 1，4-二氢吡啶：一种可靠的杂环，具有最有前途和最可预期的治疗效果。医学化学迷你评论2019;19（15）：1219-54。[22] Safak C，Simsek R.作为潜在钙调节化合物的稠合1，4-二氢吡啶。医学化学迷你评论2006;6（7）：747-55。[23] Sharma R，Kothapalli R，Dongen AMJV，Swaminathan K.新型结核分枝杆菌L-天冬氨酸α -脱羧酶抑制剂的化学信息学鉴定PloS One2012;7（3）：e33521.[24] 吴文辉，李文辉，李文辉.使用核磁共振（1H NMR）验证抗结核分枝杆菌L-天冬氨酸α-脱羧酶的药物样抑制剂。 PloS One 2012;7（9）：e45947.[25] Schütznero va�E，VerdíaP，Krch n�a�kV. 具有三维结构的稠环分子支架用于限制性肽模拟物：聚合物支持的通过N-酰基亚胺立体选择性合成四氢苯并[e]吡嗪并[2，1-c][1，2，4]噻二嗪酮6，6-二氧化物。ACS Comb Sci2016;18（10）：655-9.[26] Medina-Franco JL.利用化学信息学探索药物发现的化学空间新领域。药物开发研究2012;73（7）：430-8。[27] Dimova D，Stumpfe D，BajorathJ.量化大规模结构-活性关系信息的指纹描述符依赖性。J ChemInf Model 2013;53（9）：2275-81.[28] [10]李文辉，李文辉.虚拟筛选中的分子指纹相似性搜索。方法2015;71：58-63.[29] BemisGW，Murcko MA. 已知药物的特性1.一、分子框架。医学化学杂志1996;39（15）：2887-93.[30] 刘R，余X，Wallqvist A.数据驱动的结构警报识别，用于降低药物诱导的人类肝损伤风险。 J Cheminf 2015;7.[31] ShahNR，Seger AC，Seger DL，Fiskio JM，Kuperman GJ，Blumenfeld B，Recklet EG，Bates DW，Gandhi TK. 提高门诊护理中计算机化处方警报的接受程度。美国医学信息杂志2006;13（1）：5-11.[32] 弗莱明河人工智能如何改变药物发现Nature 2018;55 - 7：S55-7.[33] Topol EJ高性能医学：人类与人工智能的融合。Nat Med2019;25（1）：44-56。[34] [1]Bo€hmH，OestreichC，RethwilmR，FederolfP，Do€derleinL，FujakA. DussaCU：聚类分析，以确定灵活的扁平足儿童的足部运动模式，使用步态分析-一种统计方法来检测失代偿性病理？Gait Poetry2019;71：151-6.[35] Muhammad MU，Jiadong R，Muhammad NS，Hussain M，Muhammad I.糖尿病等慢性病多分类变量分类的主成分分析。 Int J Environ Res Publ Health2019;16（19）.[36] 克拉克湾群落结构变化的非参数多变量分析。AustJ Ecol 1993;18（1）：117-43.[37] Wishart DS，Feunang YD，Guo AC，Lo EJ，Marcu A，Grant JR，Sajed T，Johnson D，Li C，Sayeeda Z，et al. DrugBank 5.0：2018年DrugBank数据库的重大更新。核酸研究2018;46（D1）：D1074-82。[38] 杨文，李文 .基于 SMILES表示的卷积神经网络用于化合物化学模体检测。BMCBioinf 2018;19（增刊19）。[39] 魏宁格湾SMILES是一种化学语言和信息系统。1. 介绍方法和编码规则。化学信息计算科学杂志1988;28（1）：31-6.[40] YapCW。PaDEL-descriptor：一个计算分子描述符和指纹的开源软件。JComput Chem 2011;32（7）：1466-74.[41] Ring n'erM. 什么是主成分分析？ NatBiotechnol2008;26（3）：303-4.[42] Kanungo T，Mount DM，Netanyahu NS，Piatko C，Silverman R，Wu AY.一种有效的k-means聚类算法的分析与实现。两千[43] 汉默，哈珀DAT，瑞安警察。PAST：用于教育和数据分析的古生物学统计软件包。古电子2001;4（1）：9.[44] McKightPE，Najab J. Kruskal-Wallis检验科西尼心理学百科全书2010年。一比一[45] 王军，周松，易勇，孔军。一种改进的基于有效范围的特征选择方法。2014年世界科学杂志。 2014年。[46] [10]杨晓，王晓，王晓. 分类数据的高效分层密度聚类。J Biomed Inf2009;42（2）：365-76.[47] Kimes PK，Liu Y，Neil Hayes D，Marron JS.层次聚类的统计显著性。Biometrics2017;73（3）：811-21.[48] Arthur D，Vassilvitskii S，k-means .仔细播种的好处。2007年[49] Kaufman L，PJ.在数据中查找组：聚类分析介绍。 Wiley Series in Probabilityand Statistics，1990。

下载后可阅读完整内容，剩余1页未读，立即下载