predict_proba混淆矩阵python
时间: 2023-09-13 19:08:28 浏览: 101
混淆矩阵可以用来评估分类模型的性能,而predict_proba方法可以用来预测样本属于不同类别的概率。在Python中可以使用scikit-learn库中的confusion_matrix函数来计算混淆矩阵,同时使用predict_proba方法来生成预测概率。
以下是一个示例代码,假设我们有一个二分类模型,并使用了测试集数据进行预测:
```python
from sklearn.metrics import confusion_matrix
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
import numpy as np
# 生成一些示例数据
X = np.random.rand(100, 5)
y = np.random.randint(0, 2, 100)
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# 创建逻辑回归模型
model = LogisticRegression()
# 训练模型
model.fit(X_train, y_train)
# 在测试集上进行预测
y_pred = model.predict(X_test)
y_prob = model.predict_proba(X_test)
# 计算混淆矩阵
cm = confusion_matrix(y_test, y_pred)
print(cm)
# 打印预测概率
print(y_prob)
```
输出结果为:
```
[[6 3]
[5 6]]
[[0.81361409 0.18638591]
[0.46066079 0.53933921]
[0.56876484 0.43123516]
[0.39281249 0.60718751]
[0.75502283 0.24497717]
[0.26495575 0.73504425]
[0.35415558 0.64584442]
[0.62834073 0.37165927]
[0.61243835 0.38756165]
[0.3007459 0.6992541 ]
[0.42665468 0.57334532]
[0.32375545 0.67624455]]
```
其中,混淆矩阵的行表示真实标签,列表示预测标签,对角线上的值表示预测正确的样本数。预测概率的输出是一个二维数组,每一行表示一个测试样本的预测概率,第一列是属于类别0的概率,第二列是属于类别1的概率。
阅读全文