求两个词频向量的余弦相似性。其中 x=(0,7,0,21,0,0,3,0,0) v=(0,1,0,0,1,2,2,0,3,0)
时间: 2024-04-21 18:11:08 浏览: 107
TF-IDF与余弦相似性的应用
两个向量的余弦相似度计算公式为:
$$
\cos(\theta)=\frac{\mathbf{x}\cdot\mathbf{v}}{\left\Vert\mathbf{x}\right\Vert\left\Vert\mathbf{v}\right\Vert}
$$
其中 $\mathbf{x}$ 和 $\mathbf{v}$ 分别表示两个向量,$\cdot$ 表示向量的点积,$\left\Vert\mathbf{x}\right\Vert$ 和 $\left\Vert\mathbf{v}\right\Vert$ 分别表示两个向量的模长。
将题目中给出的数值代入公式,得到:
$$
\begin{aligned}
\left\Vert\mathbf{x}\right\Vert&=\sqrt{0^2+7^2+0^2+21^2+0^2+0^2+3^2+0^2+0^2}=22\\
\left\Vert\mathbf{v}\right\Vert&=\sqrt{0^2+1^2+0^2+0^2+1^2+2^2+2^2+0^2+3^2+0^2}=4.2426\\
\mathbf{x}\cdot\mathbf{v}&=0\times0+7\times1+0\times0+21\times0+0\times1+0\times2+3\times2+0\times0+0\times3=14\\
\end{aligned}
$$
因此,余弦相似度为:
$$
\cos(\theta)=\frac{14}{22\times 4.2426}\approx 0.1502
$$
所以,两个向量的余弦相似度约为 0.1502。
阅读全文