使用sklearn计算多分类指标：精确率、召回率与F1值

69 浏览量更新于2024-08-30 收藏 149KB PDF 举报

在机器学习领域，模型的评估是非常关键的一环，特别是在多分类任务中。多分类问题是指模型需要预测的目标变量有三个或三个以上不同的类别。在这个场景下，我们需要关注多个指标来全面评估模型的性能，比如精确率（Precision）、召回率（Recall）以及F1分数（F1-score）。这些指标可以帮助我们理解模型在处理不同类别时的表现。精确率是模型正确预测为某一类别的样本数占模型预测为该类别的样本总数的比例。公式为：精确率 = TP / (TP + FP)，其中TP是真正例（真正类别的正样本），FP是假正例（预测为正类别的负样本）。召回率又称为查全率，是模型正确预测为某一类别的样本数占实际属于该类别的样本总数的比例。公式为：召回率 = TP / (TP + FN)，其中FN是假反例（预测为负类别的正样本）。 F1分数是精确率和召回率的调和平均数，可以同时考虑两者，避免了在两者之间取舍的问题。F1分数的公式是：F1 = 2 * (精确率 * 召回率) / (精确率 + 召回率)。在给定的例子中，使用了Python的机器学习库scikit-learn（简称sklearn）的`classification_report`函数来评估多分类模型的性能。`classification_report`接受真实标签`y_true`和预测标签`y_pred`作为输入，它会计算每个类别的精确率、召回率和F1分数，以及总体的加权平均值和宏平均值。宏平均值是每个类别的指标的平均值，不考虑类别不平衡；而加权平均值则根据每个类别的样本数量进行加权。示例代码中，`target_names`参数用于指定类别的名称，以便在报告中显示。默认情况下，`classification_report`的输出是以字符串形式展示的，但可以通过设置`output_dict=True`将结果转换为字典格式，方便后续处理和分析。输出结果展示了每个类别的精确率、召回率、F1分数以及支持度（Support，即每个类别在测试集中的样本数）。总体精度（Accuracy）是所有预测正确的样本数占总样本数的比例，而宏平均和加权平均则分别给出了不考虑和考虑类别不平衡情况下的平均性能指标。通过这样的评估，我们可以了解模型在每个类别上的表现，从而针对性地优化模型，尤其是对于那些被误分类较多的类别。在实际应用中，如果某些类别特别重要或者类别分布极度不平衡，我们可能需要更关注特定类别的性能，而不仅仅是整体的精度。

使用使用sklearn对多分类的每个类别进行指标评价操作对多分类的每个类别进行指标评价操作

今天晚上，笔者接到客户的一个需要，那就是：对多分类结果的每个类别进行指标评价，也就是需要输出每个类型的精确率

（precision），召回率（recall）以及F1值（F1-score）。

对于这个需求，我们可以用sklearn来解决，方法并没有难，笔者在此仅做记录，供自己以后以及读者参考。

我们模拟的数据如下：

y_true = [‘北京’, ‘上海’, ‘成都’, ‘成都’, ‘上海’, ‘北京’, ‘上海’, ‘成都’, ‘北京’, ‘上海’] y_pred = [‘北京’, ‘上海’, ‘成都’, ‘上

海’, ‘成都’, ‘成都’, ‘上海’, ‘成都’, ‘北京’, ‘上海’]

其中y_true为真实数据，y_pred为多分类后的模拟数据。使用sklearn.metrics中的classification_report即可实现对多分类的每

个类别进行指标评价。

示例的Python代码如下：

# -*- coding: utf-8 -*-

from sklearn.metrics import classification_report

y_true = ['北京', '上海', '成都', '成都', '上海', '北京', '上海', '成都', '北京', '上海'] y_pred = ['北京', '上海', '成都', '上海', '成都', '成都',

'上海', '成都', '北京', '上海']

t = classification_report(y_true, y_pred, target_names=['北京', '上海', '成都'])

print(t)

输出结果如下：

precision recall f1-score support

北京 0.75 0.75 0.75 4

上海 1.00 0.67 0.80 3

成都 0.50 0.67 0.57 3

accuracy 0.70 10

macro avg 0.75 0.69 0.71 10

weighted avg 0.75 0.70 0.71 10

需要注意的是，输出的结果数据类型为str，如果需要使用该输出结果，则可将该方法中的output_dict参数设置为True，此时

输出的结果如下:

{‘北京': {‘precision': 0.75, ‘recall': 0.75, ‘f1-score': 0.75, ‘support': 4},

‘上海': {‘precision': 1.0, ‘recall': 0.6666666666666666, ‘f1-score': 0.8, ‘support': 3},

‘成都': {‘precision': 0.5, ‘recall': 0.6666666666666666, ‘f1-score': 0.5714285714285715, ‘support': 3},

‘accuracy': 0.7,

‘macro avg': {‘precision': 0.75, ‘recall': 0.6944444444444443, ‘f1-score': 0.7071428571428572, ‘support': 10},

‘weighted avg': {‘precision': 0.75, ‘recall': 0.7, ‘f1-score': 0.7114285714285715, ‘support': 10}}

使用confusion_matrix方法可以输出该多分类问题的混淆矩阵，代码如下：

from sklearn.metrics import confusion_matrix

y_true = ['北京', '上海', '成都', '成都', '上海', '北京', '上海', '成都', '北京', '上海'] y_pred = ['北京', '上海', '成都', '上海', '成都', '成都', '上海', '成都', '北京', '上海']

print(confusion_matrix(y_true, y_pred, labels = ['北京', '上海', '成都']))

输出结果如下：

[[2 0 1] [0 3 1] [0 1 2]]

为了将该混淆矩阵绘制成图片，可使用如下的Python代码：

# -*- coding: utf-8 -*-

# author: Jclian91

# place: Daxing Beijing

# time: 2019-11-14 21:52

from sklearn.metrics import confusion_matrix

import matplotlib.pyplot as plt

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38692122

粉丝: 13
资源: 960

使用sklearn计算多分类指标：精确率、召回率与F1值

sklearn中多分类问题各指标的计算

大数据分析技术-Sklearn操作与聚类分析模型构建与评价.doc

sklearn中多分类模型评价指标

sklearn中多标签评价指标

调用sklearn库实现对鸢尾花数据的分类，采用逻辑回归分类方法，并计算以下多分类性能评价指标（两种方式）：混淆矩阵、准确率、精确率、召回率、F1值、分类报告，并绘制PR曲线与ROC曲线。

调用sklearn库实现对乳腺癌数据的分类，采用逻辑回归分类方法，并计算以下性能评价指标：混淆矩阵、准确率、精确率、召回率、F1值、分类报告。

sklearn 朴素贝叶斯二分类

SVM多分类评价指标

pytorch多分类评价指标

多分类评价指标python代码

最新资源