把NMI = \frac{-2 \cdot \sum_{i=1}^C \sum_{j=1}^K \frac{n_{ij}}{n} \log\left(\frac{n_{ij} \cdot n}{n_i \cdot n_j}\right)}{\sum_{i=1}^C \frac{n_i}{n} \log\left(\frac{n_i}{n}\right) + \sum_{j=1}^K \frac{n_j}{n} \log\left(\frac{n_j}{n}\right)}转换成普通数学公式
时间: 2023-07-17 12:11:46 浏览: 99
computeNMI.m
将NMI的计算公式转换成普通数学公式:
NMI = \frac{-2 \cdot \sum_{i=1}^C \sum_{j=1}^K \frac{n_{ij}}{n} \log\left(\frac{n_{ij} \cdot n}{n_i \cdot n_j}\right)}{\sum_{i=1}^C \frac{n_i}{n} \log\left(\frac{n_i}{n}\right) + \sum_{j=1}^K \frac{n_j}{n} \log\left(\frac{n_j}{n}\right)}
可以进一步简化为:
NMI = \frac{2 \cdot I(C, K)}{H(C) + H(K)}
其中,
- I(C, K) 表示互信息(Mutual Information)的计算,定义为:I(C, K) = \sum_{i=1}^C \sum_{j=1}^K \frac{n_{ij}}{n} \log\left(\frac{n_{ij} \cdot n}{n_i \cdot n_j}\right)
- H(C) 表示聚类结果的熵(Entropy),定义为:H(C) = -\sum_{i=1}^C \frac{n_i}{n} \log\left(\frac{n_i}{n}\right)
- H(K) 表示真实标签的熵(Entropy),定义为:H(K) = -\sum_{j=1}^K \frac{n_j}{n} \log\left(\frac{n_j}{n}\right)
通过计算互信息、聚类结果的熵和真实标签的熵,可以得到NMI的值。
阅读全文