小分子靶向蛋白激酶抑制剂数据集的深度学习分析

版权申诉
0 下载量 201 浏览量 更新于2024-09-29 收藏 104.37MB ZIP 举报
资源摘要信息:"八种小分子靶向蛋白激酶数据集" 知识点: 1. 数据集内容:本数据集关注的是8种蛋白激酶的抑制剂,它们分别是环素依赖性激酶2 (cdk2)、表皮生长因子受体erbB1 (egfr erbB1)、糖原合成酶激酶-3B (gsk3b)、肝细胞生长因子受体 (HGFR)、MAP同工酶p38阿尔法 (map_k_p38a)、酪氨酸蛋白激酶LCK (tpk lck)、酪氨酸蛋白激酶SRC (tpk src) 和血管内皮生长因子受体2 (vegfr2)。这些激酶在多种生物学过程中起着关键作用,并且与癌症的发展密切相关。 2. 数据集来源:数据集中的抑制剂信息是从公共数据库中收集的,其中抑制剂的筛选标准为IC50值低于10 uM,这个值是衡量化合物抑制特定酶活性能力的常用指标。IC50值越低,表示化合物的抑制能力越强。当IC50值高于10 uM时,化合物通常被认为是非抑制剂。 3. 蛋白激酶的作用:蛋白激酶是细胞内的一类酶,负责将磷酸基团从高能分子转移至特定的底物蛋白上,从而激活或抑制该蛋白的功能。蛋白激酶的异常激活是导致肿瘤细胞生长、增殖及转移的关键因素,因此蛋白激酶已成为抗癌药物开发的重要靶点。 4. 小分子抑制剂:小分子抑制剂是指一类分子量较小的化合物,能够有效地与蛋白激酶的活性位点结合,从而阻断其信号传导途径。小分子抑制剂具有口服吸收好、生物利用度高、穿透细胞能力强等优点,是目前药物开发中的一个重要方向。 5. 数据集的应用:本数据集可以应用于化学信息学、药学、计算生物学等领域,用于机器学习和深度学习模型的训练。通过这些模型,研究人员可以预测未知化合物对于特定蛋白激酶的抑制能力,从而指导新药设计和发现。 6. 具体文件名称解析:文件名pubchem_neg_sample_part_1.csv、pubchem_neg_sample_part_2.csv 和pubchem_neg_sample_part_3.csv 分别代表了数据库中筛选出来的非抑制剂样本集的一部分,可能由于文件大小限制而分批保存。而vegfr2_train.csv、egfr_erbB1_train.csv、map_k_p38a_train.csv、tpk_src_train.csv、hgfr_train.csv、gsk3b_train.csv、tpk_lck_train.csv 则包含了对应激酶的训练数据集,这些数据可用于构建和训练模型。 7. 癌症治疗与蛋白激酶:癌症治疗领域中,靶向治疗越来越受到重视,蛋白激酶抑制剂在靶向治疗中扮演着重要角色。通过对蛋白激酶活性的调控,可以抑制肿瘤细胞的生长和增殖,减缓癌症进程,提高患者的生存率和生活质量。因此,针对这八种蛋白激酶的研究和药物开发对于癌症治疗具有潜在的重要价值。