首页使用python将数据集分为训练集与测试集两部分，训练集比测试集等于 8：2。通过逻辑回归算法进行建模，输出最后模型的准确率、精确率、查准率、F1、混淆矩阵

使用python将数据集分为训练集与测试集两部分，训练集比测试集等于 8：2。通过逻辑回归算法进行建模，输出最后模型的准确率、精确率、查准率、F1、混淆矩阵

时间: 2023-06-15 19:07:24 浏览: 43

下面是一个简单的Python代码示例，用于将数据集分成训练集和测试集，并使用逻辑回归算法构建模型，并输出模型的性能指标和混淆矩阵。 ```python import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix # 读取数据集 data = pd.read_csv("data.csv") # 划分数据集为训练集和测试集 train, test = train_test_split(data, test_size=0.2, random_state=42) # 获取训练集和测试集的特征和标签 X_train = train.drop('label', axis=1) y_train = train['label'] X_test = test.drop('label', axis=1) y_test = test['label'] # 创建逻辑回归模型 model = LogisticRegression() # 训练模型 model.fit(X_train, y_train) # 在测试集上进行预测 y_pred = model.predict(X_test) # 输出模型性能指标 print("Accuracy:", accuracy_score(y_test, y_pred)) print("Precision:", precision_score(y_test, y_pred)) print("Recall:", recall_score(y_test, y_pred)) print("F1-Score:", f1_score(y_test, y_pred)) # 输出混淆矩阵 print("Confusion Matrix:") print(confusion_matrix(y_test, y_pred)) ``` 需要注意的是，上面的代码中的 `data.csv` 文件应该是你自己的数据集文件，而不是一个通用的数据集。另外，你需要将代码中的 `label` 替换为你的数据集中的标签列名。