请帮我构建一个逻辑回归模型,将csv文件划分为训练集、测试集,比例为7:3,输出该模型在测试集上的准确率和召回率
时间: 2024-03-03 17:52:02 浏览: 16
好的,我可以帮你构建逻辑回归模型并评估其性能。首先,你需要导入必要的库和数据集。你可以使用 pandas 库来读取和处理 csv 文件,使用 sklearn 库中的 train_test_split 函数来将数据集划分为训练集和测试集,使用 LogisticRegression 类来构建逻辑回归模型,并使用 sklearn.metrics 库中的 accuracy_score 和 recall_score 函数来评估模型性能。
以下是实现代码:
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, recall_score
# 读取数据集
data = pd.read_csv('data.csv')
# 提取特征和标签
X = data.drop('label', axis=1)
y = data['label']
# 将数据集划分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)
# 构建逻辑回归模型
model = LogisticRegression()
# 在训练集上拟合模型
model.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = model.predict(X_test)
# 计算模型在测试集上的准确率和召回率
acc = accuracy_score(y_test, y_pred)
rec = recall_score(y_test, y_pred)
print('模型准确率:', acc)
print('模型召回率:', rec)
```
请将上面代码中的 `data.csv` 替换为你要使用的数据集文件名,并适当修改训练集和测试集的比例。输出结果将给出模型在测试集上的准确率和召回率。