2005年多环芳烃致癌活性:支持向量机的高效预测模型

需积分: 9 1 下载量 39 浏览量 更新于2024-08-12 1 收藏 2.59MB PDF 举报
2005年的《青海师范大学学报(自然科学版)》第四期发表了一篇题为“多环芳烃致癌活性的支持向量机分类模型”的论文,作者祁正兴探讨了多环芳烃(PAH)的致癌活性预测问题。该研究采用了留一交叉校验法,对比了支持向量分类法(SVM),反向传播人工神经网络(RNN)以及K最近邻(KNN)三种机器学习算法在构建PAH致癌活性分类模型中的表现。 通过实验,SVM显示出显著的优势。具体来说,SVM模型在72个样本中的错分样本数为7个,而预报准确率达到了90.28%,相比之下,RNN和KNN的错分样本数分别为28个和22个,对应的预报准确率分别为61.11%和69.44%。这表明SVM算法具有更强的稳健性和鲁棒性,对于多环芳烃致癌活性的分类和预测任务,其性能更为可靠。 论文进一步指出,双区理论在理解PAH致癌机制中扮演着关键角色,它认为PAH与DNA的化学致癌作用涉及两个官能团的交替氧化。模型构建时,研究人员利用离域能(tE1和tE2)以及脱毒区(n)的数量与致癌参数K之间的关系,以及结合其他分子参数,试图通过回归分析、Fisher判别法和人工神经网络等传统方法建立模型。然而,这些传统方法在防止过拟合和提高泛化能力方面存在问题。 SVM的结果证明了它在处理这类复杂问题时的有效性,尤其是在面对大量未测定的PAH及其衍生物致癌活性时,SVM模型的预测能力具有实用价值。因此,这项研究为多环芳烃致癌活性的定量评估提供了一种有效且精确的工具,有助于化学致癌作用研究的深入和未来PAH风险评估的发展。