python数据清洗处理各列缺失数据代码
时间: 2023-08-04 07:07:22 浏览: 79
处理缺失值的方式有很多,以下是几种常用的方法:
1. 删除缺失数据
```python
df.dropna(inplace=True)
```
2. 填充缺失数据
```python
# 使用常数填充缺失值
df.fillna(0, inplace=True)
# 使用均值填充缺失值
df.fillna(df.mean(), inplace=True)
# 使用中位数填充缺失值
df.fillna(df.median(), inplace=True)
# 使用众数填充缺失值
df.fillna(df.mode().iloc[0], inplace=True)
# 使用前一个有效值填充缺失值
df.fillna(method='ffill', inplace=True)
# 使用后一个有效值填充缺失值
df.fillna(method='bfill', inplace=True)
```
3. 插值填充缺失数据
```python
# 线性插值
df.interpolate(method='linear', inplace=True)
# 多项式插值
df.interpolate(method='polynomial', order=2, inplace=True)
# 根据索引插值
df.interpolate(method='index', inplace=True)
```
以上代码中,`df` 表示要处理的数据框,`inplace=True` 表示直接修改原数据。具体使用哪种方法填充缺失值,需要根据实际情况进行选择。
阅读全文