实体的余弦相似度计算python代码
时间: 2024-05-17 21:09:21 浏览: 88
余弦相似度计算代码
4星 · 用户满意度95%
实体的余弦相似度计算是一种用的文本相似度计算方法,可以用于比较两个实体之间的相似程度。下面是一个简单的Python代码示例:
```python
import numpy as np
from sklearn.feature_extraction.text import CountVectorizer
def cosine_similarity(entity1, entity2):
# 将实体转换为向量表示
vectorizer = CountVectorizer().fit_transform([entity1, entity2])
vectors = vectorizer.toarray()
# 计算余弦相似度
similarity = np.dot(vectors, vectors) / (np.linalg.norm(vectors) * np.linalg.norm(vectors))
return similarity
# 示例实体
entity1 = "机器学习是人工智能的一个分支"
entity2 = "人工智能包括机器学习在内的多个领域"
# 计算实体的余弦相似度
similarity_score = cosine_similarity(entity1, entity2)
print("实体的余弦相似度:", similarity_score)
```
这段代码使用了`CountVectorizer`来将实体转换为向量表示,然后通过计算向量的余弦相似度来得到实体的相似度。请注意,这只是一个简单的示例,实际应用中可能需要对文本进行预处理和特征选择等操作。
阅读全文