相似度计算python
时间: 2023-11-20 09:58:33 浏览: 105
相似度计算
以下是两种常见的相似度计算方法的Python实现:
1.余弦相似度计算
```python
import numpy as np
from numpy.linalg import norm
# 定义两个向量
A = np.array([2,1,2])
B = np.array([3,4,2])
# 计算余弦相似度
cosine = np.dot(A,B)/(norm(A)*norm(B))
print("余弦相似度:", cosine)
```
2.TF-IDF文本相似度计算
```python
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
# 定义两个文本
text1 = "This is a sample sentence."
text2 = "This is another example sentence."
# 将两个文本转换为向量
vectorizer = TfidfVectorizer()
vectors = vectorizer.fit_transform([text1, text2])
# 计算两个文本的相似度
similarity = cosine_similarity(vectors[0], vectors[1])
print("TF-IDF文本相似度:", similarity[0][0])
```
阅读全文