python代码请结合问题1，选择不超过20个分子描述符变量，构建化合物对ERα生物活性的定量预测模型，请叙述建模过程。然后使用构建的预测模型，对文件“ERα_activity.xlsx”的test表中的50个化合物进行IC50值和对应的pIC50值预测，并将结果分别填入“ERα_activity.xlsx”的test表中的IC50_nM列及对应的pIC50列。问题3. 请利用文件“Molecular_Descriptor.xlsx”提供的729个分子描述符，针对文件“ADMET.xlsx”中提供的1974个化合物的ADMET数据，从五个指标（Caco-2、CYP3A4、hERG、HOB、MN）中任选2个，分别构建其分类预测模型，并简要叙述建模过程。然后使用所构建的2个分类预测模型，对文件“ADMET.xlsx”的test表中的50个化合物进行相应的预测，并将结果填入“ADMET.xlsx”的test表中对应的Caco-2、CYP3A4、hERG、HOB、MN列。

时间: 2024-03-29 19:38:55 浏览: 178

对于问题1，选择不超过20个分子描述符变量，构建化合物对ERα生物活性的定量预测模型，建模过程如下： 1. 数据预处理：将数据集划分为训练集和测试集，对数据进行标准化处理，消除量纲的影响。 2. 特征选择：根据领域知识和统计分析方法，选择不超过20个分子描述符变量作为模型特征，例如：LogP、SMR、TPSA、NumRotatableBonds等。 3. 模型选择：选择适合数据集的回归模型，例如：多元线性回归模型、支持向量回归模型等。 4. 模型训练：使用训练集训练模型并进行模型参数调优，如正则化参数、核函数类型、损失函数等。 5. 模型评价：使用测试集评估模型性能，如均方误差（MSE）、均方根误差（RMSE）、R平方值（R2）等指标。 6. 模型应用：使用构建好的预测模型，对文件“ERα_activity.xlsx”的test表中的50个化合物进行IC50值和对应的pIC50值预测，并将结果分别填入“ERα_activity.xlsx”的test表中的IC50_nM列及对应的pIC50列。对于问题3，针对文件“ADMET.xlsx”中提供的1974个化合物的ADMET数据，从五个指标（Caco-2、CYP3A4、hERG、HOB、MN）中任选2个，分别构建其分类预测模型，建模过程如下： 1. 数据预处理：将数据集划分为训练集和测试集，对数据进行标准化处理，消除量纲的影响。 2. 特征选择：根据领域知识和统计分析方法，选择与分类指标相关的分子描述符变量作为模型特征。 3. 模型选择：选择适合数据集的分类模型，例如：逻辑回归模型、决策树模型等。 4. 模型训练：使用训练集训练模型并进行模型参数调优，如正则化参数、划分准则、决策树深度等。 5. 模型评价：使用测试集评估模型性能，如准确率、召回率、F1值等指标。 6. 模型应用：使用构建好的分类预测模型，对文件“ADMET.xlsx”的test表中的50个化合物进行相应的预测，并将结果填入“ADMET.xlsx”的test表中对应的Caco-2、CYP3A4、hERG、HOB、MN列。

阅读全文

相关推荐

Python实现股票预测的SVM模型代码解析

Python实现灰色预测模型与数据分析

Python财政收入预测模型：数据分析与算法应用

（3个国二，3种解法）2021年华为杯数学建模D题抗乳腺癌候选药物的优化建模

拮抗剂分子活性预测线性回归模型

Python实现BP神经网络回归预测模型详解

Python实现回归预测BP神经网络模型详解

cole_02_0507.pdf

工程硕士开题报告：无线传感器网络路由技术及能量优化LEACH协议研究

【东海期货-2025研报】东海贵金属周度策略：金价高位回落，阶段性回调趋势初现.pdf

图像数据处理工具+数据(帮助用户快速划分数据集并增强图像数据集。通过自动化数据处理流程，简化了深度学习项目的数据准备工作)

diminico_02_0709.pdf

agenda_3cd_01_0716.pdf

A课件Python全栈开发线下班.zip

大家在看

生产线上快速检测塑料物品的表面缺陷.rar

MASWaves-version1-07-2017_面波频散_地震面波分析与反演_面波_面波反演_MASWaves_源码

Linux常用命令全集（CHM格式）

基于DCT和Arnold的视频数字水印（含Matlab源码）

NEW.rar_fatherxbi_fpga_verilog 大作业_verilog大作业_投币式手机充电仪

最新推荐

Python实现新型冠状病毒传播模型及预测代码实例

python进阶之多线程对同一个全局变量的处理方法

python:目标检测模型预测准确度计算方式(基于IoU)

Python中利用LSTM模型进行时间序列预测分析的实现

不到40行代码用Python实现一个简单的推荐系统

FileAutoSyncBackup：自动同步与增量备份软件介绍

C语言内存管理：动态分配策略深入解析，内存不再迷途

严格来说一维不是rnn

基于MFC和OpenCV的USB相机操作示例

C语言基础精讲：掌握指针，编程新手的指路明灯