python 计算短文本相似度的代码
时间: 2024-02-06 08:38:32 浏览: 106
短文本相似度计算
4星 · 用户满意度95%
计算短文本相似度可以使用余弦相似度(cosine similarity)算法。下面是一个使用Python计算余弦相似度的例子:
```python
import numpy as np
def cosine_similarity(a, b):
"""
计算余弦相似度
"""
dot_product = np.dot(a, b)
norm_a = np.linalg.norm(a)
norm_b = np.linalg.norm(b)
return dot_product / (norm_a * norm_b)
# 将文本转换为向量
def text_to_vector(text):
words = text.lower().split()
return np.array([float(words.count(w)) for w in words])
# 计算相似度
text1 = "This is a sample sentence."
text2 = "This sentence is similar to a sample sentence."
vector1 = text_to_vector(text1)
vector2 = text_to_vector(text2)
similarity = cosine_similarity(vector1, vector2)
print(similarity)
```
在上面的代码中,`text_to_vector`函数将文本转换为向量,`cosine_similarity`函数计算余弦相似度,最后使用这两个函数计算文本的相似度。
阅读全文