使用python将数据集分为训练集与测试集两部分,训练集比测试集等于 8:2。通过逻辑回 归算法进行建模,输出最后模型的准确率、精确率、查准率、F1、混淆矩阵
时间: 2023-06-15 19:07:24 浏览: 43
下面是一个简单的Python代码示例,用于将数据集分成训练集和测试集,并使用逻辑回归算法构建模型,并输出模型的性能指标和混淆矩阵。
```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix
# 读取数据集
data = pd.read_csv("data.csv")
# 划分数据集为训练集和测试集
train, test = train_test_split(data, test_size=0.2, random_state=42)
# 获取训练集和测试集的特征和标签
X_train = train.drop('label', axis=1)
y_train = train['label']
X_test = test.drop('label', axis=1)
y_test = test['label']
# 创建逻辑回归模型
model = LogisticRegression()
# 训练模型
model.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = model.predict(X_test)
# 输出模型性能指标
print("Accuracy:", accuracy_score(y_test, y_pred))
print("Precision:", precision_score(y_test, y_pred))
print("Recall:", recall_score(y_test, y_pred))
print("F1-Score:", f1_score(y_test, y_pred))
# 输出混淆矩阵
print("Confusion Matrix:")
print(confusion_matrix(y_test, y_pred))
```
需要注意的是,上面的代码中的 `data.csv` 文件应该是你自己的数据集文件,而不是一个通用的数据集。另外,你需要将代码中的 `label` 替换为你的数据集中的标签列名。