设测试集有正例4个,反例3个,某学习器将正例样本映射为{0.9,0.7,0.6,0.2},将反例样本映射为{0.8,0.5,0.1}。 (1)画ROC图。 (2)求AUC的值。
时间: 2024-06-15 21:04:26 浏览: 71
(1)根据给定的映射结果,我们可以将正例样本和反例样本按照预测概率的降序排列,得到如下表格:
| 样本 | 预测概率 |
| ---- | -------- |
| 正例 | 0.9 |
| 正例 | 0.7 |
| 正例 | 0.6 |
| 正例 | 0.2 |
| 反例 | 0.8 |
| 反例 | 0.5 |
| 反例 | 0.1 |
接下来,我们可以根据这个表格绘制ROC曲线。ROC曲线的横轴是假正例率(FPR),纵轴是真正例率(TPR)。在这个例子中,我们可以计算出不同阈值下的FPR和TPR,然后将这些点连接起来得到ROC曲线。
首先,我们选择一个阈值为0.1,计算FPR和TPR:
- FPR = 反例样本中预测概率大于等于0.1的样本数 / 反例样本总数 = 3 / 3 = 1
- TPR = 正例样本中预测概率大于等于0.1的样本数 / 正例样本总数 = 4 / 4 = 1
接下来,我们选择一个阈值为0.2,计算FPR和TPR:
- FPR = 反例样本中预测概率大于等于0.2的样本数 / 反例样本总数 = 3 / 3 = 1
- TPR = 正例样本中预测概率大于等于0.2的样本数 / 正例样本总数 = 4 / 4 = 1
以此类推,我们可以计算出不同阈值下的FPR和TPR,得到如下表格:
| 阈值 | FPR | TPR |
| -- | --- | --- |
| 0.1 | 1 | 1 |
| 0.2 | 1 | 1 |
| 0.5 | 1 | 0.75|
| 0.6 | 1 | 0.5 |
| 0.7 | 1 | 0.25|
| 0.8 | 0.67| 0.25|
| 0.9 | 0 | 0.25|
将这些点连接起来,就得到了ROC曲线。在这个例子中,ROC曲线是一条从(0,0)到(1,1)的直线。
(2)AUC(Area Under Curve)是ROC曲线下的面积,可以用来评估分类器的性能。在这个例子中,ROC曲线是一条从(0,0)到(1,1)的直线,所以AUC的值为1。
阅读全文