在化合物与激酶的结合亲和力的预测任务中，如何证明模型具有更好的预测性能？

时间: 2024-02-22 15:01:15 浏览: 125

人工智能-机器学习-化合物的生物活性和毒性的计算预测研究.pdf

人工智能-机器学习-化合物的生物活性和毒性计算预测研究本研究论文主要应用化学信息学方法对化合物的生物活性和毒性进行计算预测研究。通过对水解酶和氧化还原酶催化的反应的分类研究，Src酪氨酸激酶ATP竞争性抑制剂和非抑制剂的分类研究，肌肉病变毒性和横纹肌溶解毒性的预测研究，以及化合物生物活性极化的系统性分析和预测研究，实现了对化合物生物活性和毒性的计算预测。一、酶催化反应分类研究传统的酶反应分类方法是EC分类系统，该方法着眼反应的各种特征，如反应类型、反应底物、被转移的基团等。本研究基于反应中心断裂和生成的化学键，选择局部原子电荷差异、6电负性差异、疋电负性差异、化学键的有效极化率.负电荷的离域稳定性和正电荷的离域稳定性6个描述符，采用自组织神经网络和支持向量机方法对水解酶催化的311个反应和氧化还原酶催化的651个反应进行了分类预测，预测正确率均大于90%，并且与EC分类系统一致。二、Src酪氨酸激酶ATP竞争性抑制剂和非抑制剂的分类研究对Src酪氨酸激酶的抑制是前列腺癌、乳腺癌等多种疾病的有效治疗手段。本研究收集了686个Src激酶ATP竞争性抑制剂和1941个非抑制剂，基于23个物理化学描述符，利用自组织神经网络和支持向量机方法，进行了Src激酶抑制剂与非抑制剂的分类预测，预测正确率均超过98%。三、肌肉病变毒性和横纹肌溶解毒性的预测研究肌肉病变毒性和横纹肌溶解毒性是他汀类药物的少见却比较严重的毒副作用，是他汀类药物的研究热点。本研究收集了232个引起肌肉病变毒性、117个不引起肌肉病变毒性、186个引起横纹肌溶解毒性以及117个不引起横纹肌溶解毒性的化合物，利用自组织神经网络和支持向量机方法，基于化合物的物理化学性质描述符，分别对肌肉病变毒性和横纹肌溶解毒性进行了预测，预测正确率均大于80%。发现原子电荷、电负性、极性等相关描述符与化合物的肌肉病变毒性和横纹肌溶解毒性有某种关系；另外还分析了化合物子结构与肌肉病变毒性和横纹肌溶解毒性的关系，发现一些子结构能够更频繁或者只出现在引起肌肉病变毒性或横纹肌溶解毒性的化合物中。四、化合物生物活性极化的系统性分析和预测研究化合物活性极化是指化合物的结构相似但其活性差异很大（通常定义活性差异，如Ki值差异，大于2个数量级），即结构上的微小改变对其活性有很大影响。在本研究中，首先采用子结构关系评估化合物的结构相似性，利用只有一个子结构不同的化合物对（即匹配分子对）来替代计算化合物的具体摘要相似性数值，进行了化合物活性极化的系统性分析（只考虑Ki值小于10μM的化合物）。从BindingDB数据库中收集了包含至少5个化合物的621个不同生物活性数据集，基于匹配分子对，系统地分析了每个数据集中的化合物活性极化以及其频率。研究发现，在活性极化化合物对中，大部分数据集中化合物活性极化频率均比较低。本研究还选择了黑素皮质素受体4（melanocortin receptor 4）、凝血酶（thrombin）、腺昔a3受体（adenosine a3 receptor）等9个数据集，利用支持向量机方法，进行活性极化匹配分子对的预测研究。设计了子结构差异核函数、子结构对核函数、匹配分子对核函数等新核函数。利用设计的新核函数，9个数据集的活性极化匹配分子对预测的平均真阳性率和"scores分别为86.2%和84.3%，平均精度和准确率分别为82.9%和95.8%。本研究中活性极化匹配分子对的预测是活性极化研究方面的首例。

在化合物与激酶的结合亲和力预测任务中，可以使用多个评价指标来证明模型具有更好的预测性能。其中最常用的评价指标是均方根误差（RMSE）和平均绝对误差（MAE），这两个指标评估了模型预测值与真实值之间的差异。此外，还可以使用相关系数（R）和R^2值来评估模型的预测能力。相关系数表示模型预测值与真实值之间的线性相关度，R^2值则表示模型解释了多少方差。另外，可以使用交叉验证的方法来评估模型的预测性能，通过将数据集划分为多个子集进行训练和测试，以评估模型的泛化能力。最后，可以将模型的预测结果与其他已有的预测方法进行比较，以证明模型具有更好的预测性能。

阅读全文

在化合物与激酶的结合亲和力的预测任务中，如何证明模型具有更好的预测性能？

相关推荐

2024-2030中国PKB Akt激酶活性测定试剂盒市场现状研究分析与发展前景预测报告.docx

论文研究 - 肌酸磷酸激酶MB是否可以预测长期心源性死亡或心房颤动？

在化合物对激酶抑制作用预测的任务中，如何证明模型具有更好的预测性能？

Rosetta_Kinase_CM:抑制剂-激酶复合物的比较模型

使用倾向评分预测未注释的磷酸肽的激酶

M2型丙酮酸激酶在肿瘤细胞中及干细胞中的研究进展

剪切因子激酶SRPK1在肿瘤中的研究进展

行业分类-设备装置-具有生物活性的3-取代苯酞类化合物.zip

IRE1激酶抑制剂高通量筛选模型的构建与优化

利用倾向评分预测未注解磷酸肽的激酶方法

实验数据回归分析与预测模型构建

基于智能温度监测系统设计.doc

最新推荐

GitHub图片浏览插件：直观展示代码中的图像

管理建模和仿真的文件

【OPPO手机故障诊断专家】：工程指令快速定位与解决

求[100，900]之间相差为12的素数对（注：要求素数对的两个素数均在该范围内）的个数

Android IPTV项目：直播频道的实时流媒体实现

"互动学习：行动中的多样性与论文攻读经历"

【OPPO手机工程模式终极指南】：掌握这些秘籍，故障排查不再难！

前端在json文件里写模板，可以换行 有空格现在在文本框的时候

机器学习在医院再入院率预测中的应用分析

关系数据表示学习

前端在json文件里写模板，可以换行有空格现在在文本框的时候