多个向量计算余弦相似度python算法
时间: 2023-09-28 20:04:22 浏览: 143
可以使用NumPy库中的dot和norm函数来计算多个向量之间的余弦相似度。假设有n个向量,每个向量有m个维度,可以将它们表示为一个n x m的矩阵。
下面是一个示例代码:
```python
import numpy as np
# 生成5个2维向量
vectors = np.random.rand(5, 2)
# 计算每个向量的模长
norms = np.linalg.norm(vectors, axis=1)
# 将模长转换为列向量
norms = norms.reshape((-1, 1))
# 计算每个向量与其他向量之间的余弦相似度
sims = np.dot(vectors, vectors.T) / (norms * norms.T)
print(sims)
```
输出结果类似于:
```
[[1. 0.96359253 0.92591863 0.94911747 0.93492504]
[0.96359253 1. 0.95376749 0.98108217 0.96536189]
[0.92591863 0.95376749 1. 0.96489926 0.97851085]
[0.94911747 0.98108217 0.96489926 1. 0.98124003]
[0.93492504 0.96536189 0.97851085 0.98124003 1. ]]
```
其中`sims[i][j]`表示第i个向量与第j个向量之间的余弦相似度。对角线上的值为1,表示每个向量与自己之间的余弦相似度为1。
阅读全文