使用【jupyter】写【计算两个项杰卡德相似度】的代码
时间: 2024-11-15 08:24:49 浏览: 5
杰卡德相似度计算(java)
5星 · 资源好评率100%
Jupyter是一个交互式的笔记本环境,常用于数据科学和机器学习项目。杰卡德相似度(Jaccard Similarity),也称为Jaccard指数,是一种衡量两个集合之间相似性的指标。下面是一个简单的Python示例,如何使用Jupyter notebook编写计算杰卡德相似度的代码:
```python
from collections import Counter
def jaccard_similarity(set1, set2):
# 将两个集合转化为Counter对象以便计数
counter1 = Counter(set1)
counter2 = Counter(set2)
# 计算交集和并集的大小
intersection = len(counter1 & counter2) # 交集
union = len(counter1 | counter2) # 并集
# 返回杰卡德相似度
return intersection / union if union != 0 else 0
# 示例
set_a = [1, 2, 3]
set_b = [2, 3, 4]
similarity = jaccard_similarity(set_a, set_b)
print(f"Set A and Set B similarity: {similarity}")
阅读全文