非线性mRMR-dCor法提升醇酚化合物毒性QSAR预测精度
153 浏览量
更新于2024-09-04
收藏 767KB PDF 举报
醇酚类化合物的毒性QSAR研究是一项重要的科学工作,由邓小龙、陈渊和谭泗桥等人合作完成。该研究关注的是如何提高化合物毒性量化结构关联关系(QSAR)模型的预测准确性,特别是在处理量子化学计算产生的大量分子描述符时。传统的QSAR分析中,化合物的毒性与描述符之间的关系往往是非线性的,这使得传统的特征选择方法,如最大相关最小冗余(mRMR),可能不适用,因为它们主要适用于线性关系和离散型自变量。
mRMR作为一种广泛使用的特征选择方法,其核心在于通过衡量相关性和冗余性来筛选出最有信息价值的特征。然而,现有的mRMR在处理连续型毒性变量时存在局限性,因为它依赖于线性相关性测量,如皮尔逊相关系数(R),这在处理非线性关系时效果不佳。为解决这一问题,邓小龙等人提出了一种创新的方法——mRMR-dCor,即结合了非线性的距离相关系数(dCor)来替代线性相关性测度。这种方法的优势在于能在非线性条件下实现相关性测度与冗余性测度的对比,从而更有效地进行特征选择。
在实际应用中,他们将mRMR-dCor应用于三个醇酚类化合物的毒性QSAR数据集上,结果显示,基于这种新方法选择特征的支持向量回归(SVR)模型具有显著的预测性能,独立预测Q2值分别达到0.954、0.941和0.981,远超于参考模型和已有的研究结果。这表明mRMR-dCor所选择的特征能够有效提高模型的预测精度,并且许多保留下来的分子描述符得到了文献的支持,证实了其有效性。
这项研究对于化合物QSAR领域以及定量构效关系(QSAR)的深入研究具有重要意义,因为它不仅改进了特征选择策略,还拓展了非线性相关性分析在化合物毒性的评估中的应用。未来,mRMR-dCor方法有望在更多化学和生物学研究中得到广泛应用,特别是在需要处理大量复杂数据并优化预测性能的情境下。同时,它也揭示了在处理非线性关系时,适当选择和利用统计工具的重要性,这对于提升整个科学研究的准确性和效率具有指导作用。
2021-05-17 上传
2021-09-26 上传
2021-05-08 上传
2021-04-24 上传
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
点击了解资源详情
weixin_38601446
- 粉丝: 7
- 资源: 939
最新资源
- 正整数数组验证库:确保值符合正整数规则
- 系统移植工具集:镜像、工具链及其他必备软件包
- 掌握JavaScript加密技术:客户端加密核心要点
- AWS环境下Java应用的构建与优化指南
- Grav插件动态调整上传图像大小提高性能
- InversifyJS示例应用:演示OOP与依赖注入
- Laravel与Workerman构建PHP WebSocket即时通讯解决方案
- 前端开发利器:SPRjs快速粘合JavaScript文件脚本
- Windows平台RNNoise演示及编译方法说明
- GitHub Action实现站点自动化部署到网格环境
- Delphi实现磁盘容量检测与柱状图展示
- 亲测可用的简易微信抽奖小程序源码分享
- 如何利用JD抢单助手提升秒杀成功率
- 快速部署WordPress:使用Docker和generator-docker-wordpress
- 探索多功能计算器:日志记录与数据转换能力
- WearableSensing: 使用Java连接Zephyr Bioharness数据到服务器