import pandas as pd data = pd.read_csv("src/death.csv", index_col='Unnamed: 0') ########### Begin ########## # 删除缺失值超过 80% 的行 # 删除缺失值超过 80% 的列 ########### End ########## print(data)
时间: 2024-03-17 08:46:52 浏览: 122
pandas中read_csv的缺失值处理方式
好的,可以使用dropna函数来删除缺失值超过80%的行或列。其中,参数thresh表示保留非缺失值的数量,如果小于该数量,则删除该行或列。下面是示例代码:
```python
import pandas as pd
# 读取数据集,假设数据集文件名为death.csv
data = pd.read_csv("death.csv", index_col='Unnamed: 0')
# 删除缺失值超过80%的行
data = data.dropna(thresh=data.shape[1]*0.2)
# 删除缺失值超过80%的列
data = data.dropna(axis=1, thresh=data.shape[0]*0.2)
# 输出处理后的数据集
print(data)
```
需要注意的是,删除行或列会改变数据集的大小,因此在删除缺失值之前需要先了解数据集的具体情况,确保删除后的数据集仍然能够满足分析需求。
阅读全文