Confusion Matrix with sklearn
时间: 2023-07-06 22:36:41 浏览: 159
Confusion Matrix in Python plot a pretty confusion matrix
混淆矩阵(Confusion Matrix)是一种用于评估分类模型性能的常用工具,它将分类器的预测结果与真实标签进行比较,并将结果分为四类:真正例(True Positive)、真反例(True Negative)、假正例(False Positive)和假反例(False Negative)。在sklearn中,可以使用confusion_matrix函数来计算混淆矩阵。下面是一个示例代码:
```python
from sklearn.metrics import confusion_matrix
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
# 生成一个分类数据集
X, y = make_classification(n_samples=100, n_features=10, n_classes=2)
# 将数据集分为训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)
# 训练逻辑回归模型
model = LogisticRegression()
model.fit(X_train, y_train)
# 对测试集进行预测
y_pred = model.predict(X_test)
# 计算混淆矩阵
cm = confusion_matrix(y_test, y_pred)
print("Confusion Matrix:\n", cm)
```
在上面的代码中,首先使用make_classification函数生成一个二分类数据集,然后将数据集分为训练集和测试集。接着,使用LogisticRegression类构建逻辑回归模型,并调用fit方法对模型进行训练。然后,使用predict方法对测试集进行预测,并使用confusion_matrix函数计算混淆矩阵。最后,将混淆矩阵打印出来,以评估模型的性能。需要注意的是,对于多分类模型而言,混淆矩阵的计算方式略有不同,通常需要使用one-vs-all的方法进行计算。
阅读全文