对于某二分类器,已知它包含 4 个正例,5 个反例 (a)请画出该二分类器对应的 PR 曲线,简述画图思路。
时间: 2023-07-14 15:14:15 浏览: 115
曲线绘制例子
绘制该二分类器的 PR 曲线的步骤如下:
1. 计算该分类器在不同阈值下的 Precision 和 Recall 值。
2. 将所得的 Precision 和 Recall 值绘制成一个坐标系图,其中横轴为 Recall 值,纵轴为 Precision 值。
3. 连接各个点(即 Precision 和 Recall 值)形成 PR 曲线。
在本例中,该分类器包含 4 个正例和 5 个反例,可以将它们按照某种顺序排列,例如按照预测得分从高到低排列。然后逐个将每个样本作为正例,其余样本作为反例,计算 Precision 和 Recall 值,得到如下表格:
| 正例 | 反例 | 阈值 | TP | FP | FN | TN | Precision | Recall |
| --- | --- | --- | --- | --- | --- | --- | --- | --- |
| 1 | 2 | 0.2 | 1 | 0 | 3 | 5 | 1.00 | 0.25 |
| 1 | 3 | 0.3 | 1 | 0 | 3 | 4 | 1.00 | 0.25 |
| 1 | 4 | 0.4 | 1 | 0 | 3 | 3 | 1.00 | 0.25 |
| 1 | 5 | 0.5 | 1 | 0 | 3 | 2 | 1.00 | 0.25 |
| 2 | 1 | 0.6 | 2 | 1 | 2 | 4 | 0.67 | 0.50 |
| 2 | 3 | 0.7 | 2 | 1 | 2 | 3 | 0.67 | 0.50 |
| 2 | 4 | 0.8 | 2 | 1 | 2 | 2 | 0.67 | 0.50 |
| 2 | 5 | 0.9 | 2 | 2 | 2 | 1 | 0.50 | 0.50 |
| 3 | 1 | 1.0 | 3 | 3 | 1 | 2 | 0.50 | 0.75 |
其中 TP 表示 True Positive,即分类器正确地将正例预测为正例的数量;FP 表示 False Positive,即分类器错误地将反例预测为正例的数量;FN 表示 False Negative,即分类器错误地将正例预测为反例的数量;TN 表示 True Negative,即分类器正确地将反例预测为反例的数量。
根据上表中的数据,我们可以绘制出该分类器的 PR 曲线,如下图所示:
![PR曲线示例](https://img-blog.csdnimg.cn/20211206162959122.png)
从图中可以看出,随着阈值的增加,Precision 值逐渐降低,而 Recall 值逐渐升高。当阈值为 0.6 时,分类器的 Precision 和 Recall 值都达到了最大值,此时的 PR 曲线上的点为最优点。
阅读全文