python 输出空值不满一半的列名
时间: 2023-06-29 19:13:15 浏览: 59
可以使用 pandas 库中的 dropna() 方法结合使用,代码如下:
```python
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv')
# 找到空值比例小于 0.5 的列名
cols_to_keep = data.columns[data.isnull().mean() < 0.5]
# 输出结果
print(cols_to_keep)
```
其中,`data.columns[data.isnull().mean() < 0.5]` 找到空值比例小于 0.5 的列名。
相关问题
python 输出空值不满一半的列
可以使用 pandas 库中的 dropna() 和 describe() 方法结合使用,代码如下:
```python
import pandas as pd
# 读取数据
data = pd.read_csv('data.csv')
# 输出空值比例
print(data.isnull().mean())
# 找到空值比例小于 0.5 的列
cols_to_keep = data.columns[data.isnull().mean() < 0.5]
# 输出结果
print(data[cols_to_keep].describe())
```
其中,`data.isnull().mean()` 用于计算每列空值的比例,`data.columns[data.isnull().mean() < 0.5]` 找到空值比例小于 0.5 的列,`data[cols_to_keep].describe()` 输出结果。
python 剔除空值不满一半的列
可以使用 pandas 库来剔除空值不满一半的列。具体步骤如下:
1. 读取数据并转换成 pandas 的 DataFrame 格式。
``` python
import pandas as pd
df = pd.read_csv('data.csv')
```
2. 计算每一列的空值占比。
``` python
null_ratio = df.isnull().sum() / len(df)
```
3. 获取空值占比小于等于 0.5 的列名。
``` python
cols_to_keep = null_ratio[null_ratio <= 0.5].index
```
4. 保留空值占比小于等于 0.5 的列。
``` python
df = df[cols_to_keep]
```
这样就可以剔除空值不满一半的列了。
阅读全文