如何删去datafram对象中空缺值比例大于0.2的列
时间: 2024-02-25 08:53:15 浏览: 78
可以使用pandas库中的dropna()方法来删除空缺值比例大于0.2的列。具体来说,可以将df对象中空缺值比例大于0.2的列的名称保存在一个名为cols_to_drop的列表中,然后使用drop()方法将这些列从df对象中删除。代码示例如下:
```python
# 找出空缺值比例大于0.2的列
cols_to_drop = df.columns[df.isnull().mean() > 0.2]
# 删除这些列
df = df.drop(cols_to_drop, axis=1)
```
上述代码中,isnull().mean()方法返回的是每列空缺值比例的均值,由于均值大于0.2表示该列空缺值比例大于0.2,因此使用布尔索引选出需要删除的列的名称,并保存在cols_to_drop变量中。最后,使用drop()方法删除这些列,axis=1表示按列删除。
阅读全文