NMI计算的具体公式和举例
时间: 2024-04-17 19:23:02 浏览: 38
NMI(Normalized Mutual Information)是一种用于衡量聚类结果与真实标签之间的相似度的指标。其计算公式如下:
首先,定义以下符号:
- n:数据样本总数
- C:聚类结果的类别数
- K:真实标签的类别数
- n_ij:同时属于聚类结果中第i类和真实标签中第j类的样本数
- n_i:聚类结果中第i类的样本数
- n_j:真实标签中第j类的样本数
根据上述符号,NMI的计算公式为:
NMI = \frac{-2 \cdot \sum_{i=1}^C \sum_{j=1}^K \frac{n_{ij}}{n} \log\left(\frac{n_{ij} \cdot n}{n_i \cdot n_j}\right)}{\sum_{i=1}^C \frac{n_i}{n} \log\left(\frac{n_i}{n}\right) + \sum_{j=1}^K \frac{n_j}{n} \log\left(\frac{n_j}{n}\right)}
其中,log表示以2为底的对数。
举个例子来说明NMI的计算过程:
假设有如下的聚类结果和真实标签:
聚类结果:[1, 1, 2, 2, 2, 3, 3, 4, 4, 4]
真实标签:[A, A, B, B, B, C, C, D, D, D]
根据聚类结果和真实标签,可以得到以下统计信息:
- n:样本总数 = 10
- C:聚类结果的类别数 = 4
- K:真实标签的类别数 = 4
- n_ij:同时属于聚类结果中第i类和真实标签中第j类的样本数
- n_11 = 2(聚类结果类别1中有2个样本与真实标签类别A相对应)
- n_12 = 0
- n_13 = 0
- n_14 = 0
- n_21 = 0
- n_22 = 3(聚类结果类别2中有3个样本与真实标签类别B相对应)
- n_23 = 0
- n_24 = 0
- n_31 = 0
- n_32 = 0
- n_33 = 2(聚类结果类别3中有2个样本与真实标签类别C相对应)
- n_34 = 0
- n_41 = 0
- n_42 = 0
- n_43 = 0
- n_44 = 3(聚类结果类别4中有3个样本与真实标签类别D相对应)
- n_i:聚类结果中第i类的样本数
- n_1 = 2
- n_2 = 3
- n_3 = 2
- n_4 = 3
- n_j:真实标签中第j类的样本数
- n_A = 2
- n_B = 3
- n_C = 2
- n_D = 3
将以上统计信息代入NMI的计算公式,可以计算得到NMI的值。
相关推荐
![gz](https://img-home.csdnimg.cn/images/20210720083447.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)