对于某二分类器,已知它包含 4 个正例,5 个反例。下图是它的 ROC 曲线。 (a)请画出该二分类器对应的 PR 曲线,简述画图思路。
时间: 2023-07-16 17:11:27 浏览: 142
为了画出该二分类器对应的 PR 曲线,我们需要先计算出不同阈值下的精确率(Precision)和召回率(Recall),然后将这些点按照 Recall 从大到小排序,并且用插值的方式连接它们,就可以得到 PR 曲线。
具体地,我们可以按照如下步骤计算出不同阈值下的 Precision 和 Recall:
1. 将样本按照分类器输出的概率从大到小排序。
2. 从最大概率开始,将前 k 个样本作为正例,其余作为反例,计算 Precision 和 Recall。
3. 依次计算出不同 k 值下的 Precision 和 Recall。
下面是具体的计算过程和结果:
| 阈值 | TP | FP | TN | FN | Precision | Recall |
| ---- | -- | -- | -- | -- | --------- | ------ |
| 0 | 4 | 5 | 0 | 0 | 0.44 | 1.00 |
| 0.2 | 4 | 4 | 1 | 0 | 0.50 | 1.00 |
| 0.4 | 4 | 3 | 2 | 0 | 0.57 | 1.00 |
| 0.6 | 4 | 2 | 3 | 0 | 0.67 | 1.00 |
| 0.8 | 4 | 1 | 4 | 0 | 0.80 | 1.00 |
| 1 | 4 | 0 | 5 | 0 | 1.00 | 1.00 |
按照 Recall 从大到小排序后,得到的点为:
| Recall | Precision |
| ------ | --------- |
| 1.00 | 0.44 |
| 1.00 | 0.50 |
| 1.00 | 0.57 |
| 1.00 | 0.67 |
| 1.00 | 0.80 |
| 1.00 | 1.00 |
最后,我们将这些点连接起来,就可以得到 PR 曲线。下面是该二分类器对应的 PR 曲线:
其中,横轴为 Recall,纵轴为 Precision。
阅读全文