二分类法 混淆矩阵代码
时间: 2024-10-10 14:15:52 浏览: 44
matlab1.rar_极限学习_极限学习机_极限学习机二分类源代码
二分类法是一种常见的机器学习分类方法,它用于区分两个类别,比如预测结果是正面还是负面、疾病是否发生等。混淆矩阵是一个统计工具,用于评估模型对两类预测结果的性能。它将实际结果分为四类:真正例(True Positive, TP)、真反例(True Negative, TN)、假正例(False Positive, FP)以及假反例(False Negative, FN)。通过混淆矩阵,我们可以计算出精度(Precision)、召回率(Recall)、F1分数(F1 Score)等关键指标。
下面是一个简单的Python代码示例,使用sklearn库来创建并解释混淆矩阵:
```python
from sklearn.metrics import confusion_matrix
from sklearn.model_selection import train_test_split
import pandas as pd
# 假设我们有一个数据集df,包含特征X和标签y
X = df['features']
y = df['labels']
# 划分训练集和测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)
# 训练模型
model.fit(X_train, y_train)
# 预测测试集
y_pred = model.predict(X_test)
# 创建混淆矩阵
conf_mat = confusion_matrix(y_test, y_pred)
# 将混淆矩阵转换为pandas DataFrame
conf_df = pd.DataFrame(conf_mat, columns=['Predicted Negative', 'Predicted Positive'],
index=['Actual Negative', 'Actual Positive'])
print(conf_df)
```
在这个例子中,`conf_mat`就是混淆矩阵,你可以从这个矩阵中分析模型的表现。
阅读全文