调用sklearn库实现对鸢尾花数据的分类,采用逻辑回归分类方法,并计算以下多分类性能评价指标(两种方式):混淆矩阵、准确率、精确率、召回率、F1值、分类报告,并绘制PR曲线与ROC曲线。
时间: 2023-12-24 08:05:25 浏览: 88
基于sklearn的LogisticRegression鸢尾花多类分类实践
好的,以下是对鸢尾花数据的分类的代码,包括逻辑回归分类方法和多分类性能评价指标的计算和绘制PR曲线与ROC曲线的代码。
```python
from sklearn.datasets import load_iris
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix, accuracy_score, precision_score, recall_score, f1_score, classification_report, plot_precision_recall_curve, plot_roc_curve
from sklearn.model_selection import train_test_split
# 加载数据集
iris = load_iris()
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=42)
# 创建逻辑回归分类器
clf = LogisticRegression(multi_class='multinomial', solver='lbfgs')
# 训练模型
clf.fit(X_train, y_train)
# 预测测试集
y_pred = clf.predict(X_test)
# 计算混淆矩阵
cm = confusion_matrix(y_test, y_pred)
print("Confusion Matrix:\n", cm)
# 计算准确率
acc = accuracy_score(y_test, y_pred)
print("Accuracy:", acc)
# 计算精确率
precision = precision_score(y_test, y_pred, average='macro')
print("Precision:", precision)
# 计算召回率
recall = recall_score(y_test, y_pred, average='macro')
print("Recall:", recall)
# 计算F1值
f1 = f1_score(y_test, y_pred, average='macro')
print("F1 Score:", f1)
# 打印分类报告
report = classification_report(y_test, y_pred)
print("Classification Report:\n", report)
# 绘制PR曲线
plot_precision_recall_curve(clf, X_test, y_test)
plt.show()
# 绘制ROC曲线
plot_roc_curve(clf, X_test, y_test)
plt.show()
```
在这段代码中,我们首先加载了鸢尾花数据集并将其划分为训练集和测试集。然后,我们创建了逻辑回归分类器,并将其用于训练模型和预测测试集。接下来,我们使用sklearn.metrics库中的函数计算了混淆矩阵、准确率、精确率、召回率、F1值和分类报告,并使用plot_precision_recall_curve()和plot_roc_curve()函数绘制了PR曲线和ROC曲线。
如果你需要进一步的解释或有任何问题,请告诉我。
阅读全文