sklearn metrics模块中常用方法与函数
时间: 2024-12-19 18:16:51 浏览: 3
`sklearn.metrics`模块提供了广泛用于评估机器学习模型性能的工具,特别是在分类和回归任务中。这里列举一些常用的方法与函数:
1. **精度(Precision)**[^2]: 衡量预测为正类的样本中有多少实际上是正类。对于多标签分类,它计算每个类别的精确度。
```python
from sklearn.metrics import precision_score
y_true = [...]
y_pred = [...]
precision = precision_score(y_true, y_pred, average='weighted') # 或者'binary', 'micro', 'macro'
```
2. **召回率(Recall)**: 衡量实际为正类的样本中被正确识别为正类的比例。
```python
recall = recall_score(y_true, y_pred, average='weighted')
```
3. **F1分数(F1 Score)**: 平衡了精度和召回率,是二者的调和平均数。
```python
f1 = f1_score(y_true, y_pred, average='weighted')
```
4. **支持度(Support)**: 指的是某个类别在测试集中出现的次数。
```python
support = support_score(y_true, y_pred)
```
5. **混淆矩阵 Confusion Matrix**[^1]: 可以用来直观地展示模型的分类效果,包括真阳性(TP), 假阳性(FP), 真阴性(TN), 假阴性(FN)。
```python
cm = confusion_matrix(y_true, y_pred)
```
6. **ROC曲线和AUC(Area Under Curve)**: 用于评估二分类模型的性能,特别是不平衡数据情况下的表现。
```python
roc_auc = roc_auc_score(y_true, y_score)
```
这些只是`sklearn.metrics`的一部分功能,具体选择哪种方法取决于您的任务需求和模型类型。
阅读全文