优化这款代码def compare(): text1 = text_new text2 = text_old tf_idf_vectorizer = TfidfVectorizer() tf_idf_vectors = tf_idf_vectorizer.fit_transform([text1, text2]) cosine_similarities = cosine_similarity(tf_idf_vectors) return cosine_similarities[0, 1]增加逐一对比功能
时间: 2024-02-01 13:14:54 浏览: 104
可以将需要逐一对比的文本存储在列表中,然后使用两重循环来遍历所有文本对,计算它们之间的相似度。以下是修改后的代码示例:
```
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity
def compare(text_list):
tf_idf_vectorizer = TfidfVectorizer()
tf_idf_vectors = tf_idf_vectorizer.fit_transform(text_list)
n = len(text_list)
similarities = []
for i in range(n):
for j in range(i+1, n):
cosine_similarity = cosine_similarity(tf_idf_vectors[i], tf_idf_vectors[j])[0][0]
similarities.append((i, j, cosine_similarity))
return similarities
```
这个函数将返回一个列表,其中每个元素都表示一对文本之间的相似度。每个元素都是一个三元组,包含两个文本的索引和它们之间的余弦相似度。例如,如果输入列表中有三个文本,函数将返回以下类似的结果:
```
[(0, 1, 0.732), (0, 2, 0.581), (1, 2, 0.812)]
```
这表示第一个文本和第二个文本之间的相似度为 0.732,第一个文本和第三个文本之间的相似度为 0.581,第二个文本和第三个文本之间的相似度为 0.812。
阅读全文
相关推荐
![rar](https://img-home.csdnimg.cn/images/20241231044955.png)
![rar](https://img-home.csdnimg.cn/images/20241231044955.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![-](https://img-home.csdnimg.cn/images/20241226111658.png)
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![pptx](https://img-home.csdnimg.cn/images/20241231044947.png)
![zip](https://img-home.csdnimg.cn/images/20241231045053.png)
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)
![pdf](https://img-home.csdnimg.cn/images/20241231044930.png)