首页fowlkes-mallows 指数是聚类算法的外部评价指标，已知真实标签y_true = [2, 2, 1, 2, 1, 0, 2, 0, 0, 1, 2, 0, 0, 2, 0, 2, 1, 0, 1, 0]，读入预测标签 y_pred =[2, 2, 2, 1, 2, 2, 2, 1, 2, 2, 2, 0, 1, 2, 0, 1, 1, 0, 1, 1]，利用公式计算混淆矩阵里面TP FP TN FN的值，并计算 FM 系数

fowlkes-mallows 指数是聚类算法的外部评价指标，已知真实标签y_true = [2, 2, 1, 2, 1, 0, 2, 0, 0, 1, 2, 0, 0, 2, 0, 2, 1, 0, 1, 0]，读入预测标签 y_pred =[2, 2, 2, 1, 2, 2, 2, 1, 2, 2, 2, 0, 1, 2, 0, 1, 1, 0, 1, 1]，利用公式计算混淆矩阵里面TP FP TN FN的值，并计算 FM 系数

时间: 2023-06-25 17:04:53 浏览: 160

根据 fowlkes-mallows 指数的定义，需要先计算混淆矩阵里面的 TP、FP、TN、FN 值，然后代入公式计算 FM 系数。首先，计算混淆矩阵： | | y_pred=0 | y_pred=1 | y_pred=2 | | ------------ | -------- | -------- | -------- | | y_true=0 | 4 | 2 | 1 | | y_true=1 | 3 | 2 | 2 | | y_true=2 | 1 | 1 | 4 | 其中，TP 表示预测类别为 i 且真实类别也为 i 的样本数，FP 表示预测类别为 i 但真实类别不为 i 的样本数，TN 表示预测类别不为 i 且真实类别也不为 i 的样本数，FN 表示预测类别不为 i 但真实类别为 i 的样本数。例如，对于第一行第一列的值 4，表示预测为 0 且真实为 0 的样本数，即 TP=4。根据混淆矩阵，可以得到 TP、FP、TN、FN 的值： - TP=4，FP=4，TN=10，FN=2（当 i=0 时） - TP=2，FP=6，TN=8，FN=4（当 i=1 时） - TP=4，FP=1，TN=15，FN=0（当 i=2 时）将这些值代入 fowlkes-mallows 指数的公式： $$FM = \sqrt{\frac{TP}{TP+FP}\times\frac{TP}{TP+FN}}$$ 计算得到： - FM(0)=0.485 - FM(1)=0.320 - FM(2)=0.667 因此，fowlkes-mallows 指数为 FM = (FM(0) + FM(1) + FM(2)) / 3 = 0.491。

阅读全文