使用【】写【文本相似度分析】的代码
时间: 2024-10-19 17:07:01 浏览: 51
计算文本相似度代码5.0_代码相似度_unionecb_textcomparison_textsimilarity_文本相似度_
在Python中,我们可以使用一些自然语言处理库如`NLTK`、`spaCy`或者`scikit-learn`里的`TfidfVectorizer`和`cosine_similarity`来进行文本相似度分析。这里是一个简单的例子,使用`TfidfVectorizer`计算两个字符串之间的余弦相似度:
```python
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
# 定义文本相似度函数
def text_similarity(text1, text2):
vectorizer = TfidfVectorizer()
vectors = vectorizer.fit_transform([text1, text2])
# 计算余弦相似度
similarity_score = cosine_similarity(vectors)[0][1]
return similarity_score
# 示例使用
text1 = "这是一段示例文本"
text2 = "这是另一段相似的文本"
score = text_similarity(text1, text2)
print(f"文本相似度得分:{score}")
阅读全文