python聚类评价指标 ari
时间: 2024-12-29 19:26:34 浏览: 20
### Python 中用于评估聚类效果的 ARI (Adjusted Rand Index)
#### 定义与计算
调整兰德系数(Adjusted rand index,ARI)衡量的是两个数据分布之间的吻合程度。取值范围为 \([-1,1]\),其中 \(1\) 表示完全一致的数据分布,而负数表示随机分配下的预期索引减去观察到的一致性比率的结果[^3]。
对于给定的真实标签和预测标签,可以利用 `sklearn` 库中的函数来快速获得这两个标签集间的 ARI 值:
```python
from sklearn.metrics.cluster import adjusted_rand_score
true_labels = [0, 0, 1, 2, 2]
predicted_labels = [1, 1, 0, 0, 2]
ari_value = adjusted_rand_score(true_labels, predicted_labels)
print(f'ARI Value: {ari_value:.4f}')
```
这段代码展示了如何通过调用 `adjusted_rand_score()` 函数并传入真实的类别标签列表以及模型预测得到的类别标签列表来获取两者之间 ARI 的具体数值[^2]。
#### 解释
当比较两组不同的分群方案时,如果它们几乎相同,则会返回接近于 \(1\) 的高分数;反之则可能是一个较低甚至可能是负数的得分。值得注意的是,在某些情况下即使两个分类并不相等也可能得到较高的 ARI 得分,只要这些分类内部成员间的关系相似即可。
阅读全文