基于机器学习的蛋白质-小分子相互作用预测:提升药物设计精准度
版权申诉
164 浏览量
更新于2024-07-02
收藏 1.98MB PDF 举报
随着信息技术的飞速发展,人工智能和机器学习在各个领域的应用越来越广泛,特别是在药物研发领域,计算机辅助药物设计(Computer-Aided Drug Design, CAD)扮演了关键角色。其中,分子对接是结构基础药物设计的重要步骤,它涉及到预测蛋白质(proteins)与小分子配体(ligands)之间的相互作用,这些作用的强度决定了化合物与目标蛋白的结合效率。传统的对接结果评价通常依赖于力场、基于知识或基于经验的打分方法,但这些方法可能缺乏足够的预测精度或者处理速度。
本文主要关注的是如何利用机器学习技术提升蛋白质与小分子间的相互作用预测。作者提出了一种基于机器学习的新型预测方法,该方法基于分子对接后的三维结构,通过提取和选择描述蛋白质和小分子间相互作用的特征,即分子原子描述符(descriptors),并利用随机森林(Random Forest)算法进行模型构建。随机森林是一种强大的集成学习方法,它能处理大量的输入特征,并在保持预测性能的同时降低过拟合的风险。
研究者选择了PDB Benchmark 2013版的数据集,包含了丰富的结构信息,如蛋白结构、配体结构、复合物结构以及活性数据,共计2959个样本,其中2764个用于训练,195个用于测试。实验结果显示,结合两种成熟打分方法(如SFCscore和RF.score)的改进版本,其训练集和测试集的交叉验证得分分别为0.74和0.77,显示了机器学习方法在预测方面的潜力。
通过对RF.score方法中的描述符进行细化,进一步优化了模型,训练集和测试集的得分分别提升至0.75和0.74。这表明增加描述符的多样性以及对原子对类型更精细的考虑有助于提升预测的准确性。未来的研究方向将朝着将原子对间的精确距离转换为势能,纳入描述符中,这有望在理论上显著提升预测的性能。
总结来说,本文的研究展示了如何利用机器学习技术改进传统药物设计中的打分方法,通过选择和组合有效的描述符以及优化随机森林模型,以提高蛋白质与小分子间相互作用的预测精度,对于推动药物研发的效率和效果具有重要意义。关键词包括分子对接、计算机辅助药物设计、机器学习、描述符、随机森林等,这些都是当前药物设计领域前沿研究的重点。
220 浏览量
2022-04-14 上传
2022-05-24 上传
2022-04-12 上传
2021-09-25 上传
2021-08-14 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
programyp
- 粉丝: 90
- 资源: 9323
最新资源
- Struts In Action (Manning).pdf
- FPGA-CPLD 数字电路设计经验分享
- Ubuntu Server Administration(2009).pdf
- 2009年四级网络工程师模拟试题及答案
- dissecting mfc
- STK ——Satellite Tool Kit(卫星工具箱)学习课件
- c#word操作的常用方法
- MyEclipse中运行Shark源代码
- 棋盘覆盖问题.doc
- matlab函数大全
- 计算机组成原理答案,供大家参考
- Hough变换检测直线Matlab代码
- Advanced_bash_scripting_guide.pdf
- 26步获得 网站流量
- JAVA认证-310-055-Q&A-TEST KILLER
- 谭浩强C语言word版