fowlkes-mallows 指数是聚类算法的外部评价指标,已知真实标签y_true = [2, 2, 1, 2, 1, 0, 2, 0, 0, 1, 2, 0, 0, 2, 0, 2, 1, 0, 1, 0],读入预测标签 y_pred =[2, 2, 2, 1, 2, 2, 2, 1, 2, 2, 2, 0, 1, 2, 0, 1, 1, 0, 1, 1],利用公式计算混淆矩阵里面TP FP TN FN的值,并计算 FM 系数
时间: 2023-06-25 17:04:53 浏览: 160
根据 fowlkes-mallows 指数的定义,需要先计算混淆矩阵里面的 TP、FP、TN、FN 值,然后代入公式计算 FM 系数。
首先,计算混淆矩阵:
| | y_pred=0 | y_pred=1 | y_pred=2 |
| ------------ | -------- | -------- | -------- |
| y_true=0 | 4 | 2 | 1 |
| y_true=1 | 3 | 2 | 2 |
| y_true=2 | 1 | 1 | 4 |
其中,TP 表示预测类别为 i 且真实类别也为 i 的样本数,FP 表示预测类别为 i 但真实类别不为 i 的样本数,TN 表示预测类别不为 i 且真实类别也不为 i 的样本数,FN 表示预测类别不为 i 但真实类别为 i 的样本数。
例如,对于第一行第一列的值 4,表示预测为 0 且真实为 0 的样本数,即 TP=4。
根据混淆矩阵,可以得到 TP、FP、TN、FN 的值:
- TP=4,FP=4,TN=10,FN=2(当 i=0 时)
- TP=2,FP=6,TN=8,FN=4(当 i=1 时)
- TP=4,FP=1,TN=15,FN=0(当 i=2 时)
将这些值代入 fowlkes-mallows 指数的公式:
$$FM = \sqrt{\frac{TP}{TP+FP}\times\frac{TP}{TP+FN}}$$
计算得到:
- FM(0)=0.485
- FM(1)=0.320
- FM(2)=0.667
因此,fowlkes-mallows 指数为 FM = (FM(0) + FM(1) + FM(2)) / 3 = 0.491。
阅读全文