当测试数据集中正负样本数量差别较大时,应该使用 PR 曲线还是 ROC 曲线?请简述 原因。
时间: 2023-07-16 16:11:29 浏览: 172
基于Python绘制PR曲线与ROC曲线完整源码+说明文档+数据(课程设计).zip
5星 · 资源好评率100%
在测试数据集中正负样本数量差别较大时,建议使用 PR 曲线。
PR 曲线是 Precision-Recall 曲线的简称,它以召回率 Recall 为横轴,精确率 Precision 为纵轴,可用来评估分类器在不同阈值下的性能表现。PR 曲线适用于样本不平衡的情况,可以更好地反映出正例的预测能力。
ROC 曲线是 Receiver Operating Characteristic 曲线的简称,它以真正率 TPR(true positive rate)为纵轴,假正率 FPR(false positive rate)为横轴,可用来评估分类器在不同阈值下的性能表现。ROC 曲线适用于正负样本数量相近的情况,可以更好地反映出分类器的整体性能。
因此,当测试数据集中正负样本数量差别较大时,使用 ROC 曲线可能会导致假正率过低,无法准确反映分类器在正例上的性能表现,而 PR 曲线则更能反映出正例的预测能力,更适合用来评估分类器的性能。
阅读全文