import pandas as pd from sklearn import metrics house=pd.read_csv("C:\量化分析\housing.csv") house=house[['view','grade','condition']] house=pd.get_dummies(house,columns=['view','grade','condition']) u,v=house.sample(n=1),house.sample(n=1) metrics.pairwise.distance.jaccard(u,v)报错怎么解决?
时间: 2023-12-18 13:04:02 浏览: 96
Pandas之read_csv()读取文件跳过报错行的解决
5星 · 资源好评率100%
这个报错可能是因为你没有正确导入 `metrics` 模块中的 `pairwise` 子模块。你可以在代码开头添加以下语句来导入 `pairwise` 子模块:
```
from sklearn.metrics.pairwise import pairwise_distances
```
然后,将 `metrics.pairwise.distance.jaccard(u,v)` 替换为 `pairwise_distances(u.values, v.values, metric='jaccard')`,就可以使用 Jaccard 距离计算 `u` 和 `v` 之间的距离了。完整代码如下:
```
import pandas as pd
from sklearn.metrics.pairwise import pairwise_distances
house = pd.read_csv("C:\量化分析\housing.csv")
house = house[['view','grade','condition']]
house = pd.get_dummies(house, columns=['view', 'grade', 'condition'])
u, v = house.sample(n=1), house.sample(n=1)
distance = pairwise_distances(u.values, v.values, metric='jaccard')
print(distance)
```
阅读全文