首页如何删去datafram对象中空缺值比例大于0.2的列

如何删去datafram对象中空缺值比例大于0.2的列

时间: 2024-02-25 08:53:15 浏览: 78

可以使用pandas库中的dropna()方法来删除空缺值比例大于0.2的列。具体来说，可以将df对象中空缺值比例大于0.2的列的名称保存在一个名为cols_to_drop的列表中，然后使用drop()方法将这些列从df对象中删除。代码示例如下： ```python # 找出空缺值比例大于0.2的列 cols_to_drop = df.columns[df.isnull().mean() > 0.2] # 删除这些列 df = df.drop(cols_to_drop, axis=1) ``` 上述代码中，isnull().mean()方法返回的是每列空缺值比例的均值，由于均值大于0.2表示该列空缺值比例大于0.2，因此使用布尔索引选出需要删除的列的名称，并保存在cols_to_drop变量中。最后，使用drop()方法删除这些列，axis=1表示按列删除。

阅读全文