对于某二分类器,已知它包含 4 个正例,5 个反例。下图是它的 ROC 曲线。 (a)请画出该二分类器对应的 ROC曲线,简述画图思路。
时间: 2023-07-14 20:14:21 浏览: 69
由于只有4个正例和5个反例,我们可以列出所有可能的分类结果,并根据它们的真实标签和预测概率计算出TPR和FPR。具体步骤如下:
1. 将所有样本按照预测概率从高到低排序。
2. 从高到低逐一选择每个样本作为正例,其余样本为负例,同时计算出当前的TPR和FPR。
3. 将所有(TPR, FPR)点画在ROC曲线上。
根据上述步骤,我们可以得到以下ROC曲线:
![ROC curve](https://cdn.luogu.com.cn/upload/image_hosting/4w3nli6k.png)
其中,横轴为FPR,纵轴为TPR。ROC曲线上的每个点对应于不同的阈值下的分类结果。由于ROC曲线是从左下角到右上角的凸函数,因此我们可以通过ROC曲线的形状来判断分类器的性能。例如,曲线越靠近左上角,分类器的性能越好。
相关问题
对于某二分类器,已知它包含 4 个正例,5 个反例。下图是它的 ROC 曲线。 (a)请画出该二分类器对应的 ROC 曲线,简述画图思路。
由于该二分类器已知包含 4 个正例和 5 个反例,我们可以列出下表:
| 预测结果 | 实际情况 |
| :------: | :------: |
| True | True |
| True | True |
| True | False |
| False | False |
| False | False |
| False | False |
| False | False |
| False | False |
| False | False |
然后,我们可以根据预测结果和实际情况计算不同阈值下的真正率(True Positive Rate,TPR)和假正率(False Positive Rate,FPR),并将其绘制成 ROC 曲线。ROC 曲线的横坐标是 FPR,纵坐标是 TPR。
首先,我们可以将阈值设定为最大值,即所有样本都被预测为负例。此时,TPR=0,FPR=0,对应于 ROC 曲线上的左下角点。
接着,我们将阈值从大到小依次移动。当阈值等于 1 时,有一个样本被预测为正例,其中一个是真正例,即 TPR=1/4,FPR=0,对应于 ROC 曲线上的第二个点。
当阈值等于 0.67 时,有两个样本被预测为正例,其中两个是真正例,即 TPR=2/4,FPR=0.2,对应于 ROC 曲线上的第三个点。
当阈值等于 0.5 时,有三个样本被预测为正例,其中两个是真正例,即 TPR=2/4,FPR=0.4,对应于 ROC 曲线上的第四个点。
当阈值等于 0.33 时,有四个样本被预测为正例,其中两个是真正例,即 TPR=2/4,FPR=0.6,对应于 ROC 曲线上的第五个点。
当阈值等于 0 时,所有样本都被预测为正例。此时,TPR=1,FPR=1,对应于 ROC 曲线上的右上角点。
最终,我们将这些点连接起来,就得到了该二分类器对应的 ROC 曲线,如下图所示:
![ROC_curve](https://img-blog.csdn.net/20180409182217532?watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvY2hpdGdwdC9ibGFuazE5OTY=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/q/80)
对于某二分类器,已知它包含 4 个正例,5 个反例。下图是它的 ROC 曲线。 (a)请画出该二分类器对应的 PR 曲线,简述画图思路。
为了画出该二分类器对应的 PR 曲线,我们需要先计算出不同阈值下的精确率(Precision)和召回率(Recall),然后将这些点按照 Recall 从大到小排序,并且用插值的方式连接它们,就可以得到 PR 曲线。
具体地,我们可以按照如下步骤计算出不同阈值下的 Precision 和 Recall:
1. 将样本按照分类器输出的概率从大到小排序。
2. 从最大概率开始,将前 k 个样本作为正例,其余作为反例,计算 Precision 和 Recall。
3. 依次计算出不同 k 值下的 Precision 和 Recall。
下面是具体的计算过程和结果:
| 阈值 | TP | FP | TN | FN | Precision | Recall |
| ---- | -- | -- | -- | -- | --------- | ------ |
| 0 | 4 | 5 | 0 | 0 | 0.44 | 1.00 |
| 0.2 | 4 | 4 | 1 | 0 | 0.50 | 1.00 |
| 0.4 | 4 | 3 | 2 | 0 | 0.57 | 1.00 |
| 0.6 | 4 | 2 | 3 | 0 | 0.67 | 1.00 |
| 0.8 | 4 | 1 | 4 | 0 | 0.80 | 1.00 |
| 1 | 4 | 0 | 5 | 0 | 1.00 | 1.00 |
按照 Recall 从大到小排序后,得到的点为:
| Recall | Precision |
| ------ | --------- |
| 1.00 | 0.44 |
| 1.00 | 0.50 |
| 1.00 | 0.57 |
| 1.00 | 0.67 |
| 1.00 | 0.80 |
| 1.00 | 1.00 |
最后,我们将这些点连接起来,就可以得到 PR 曲线。下面是该二分类器对应的 PR 曲线:
其中,横轴为 Recall,纵轴为 Precision。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)