pandas填充空值方法
时间: 2023-07-12 22:50:55 浏览: 120
解决pandas.DataFrame.fillna 填充Nan失败的问题
在 Pandas 中,有多种方法可以填充空值,以下是常用的几种方法:
1. 使用 fillna() 方法填充空值
fillna() 方法可以将空值替换为指定的值,例如将空值替换为 0:
```python
import pandas as pd
# 读取 csv 文件
df = pd.read_csv('file.csv')
# 使用 fillna 方法将空值填充为 0
df.fillna(0, inplace=True)
# 将处理后的数据写入新的 csv 文件
df.to_csv('new_file.csv', index=False)
```
2. 使用 ffill 或 bfill 方法填充空值
ffill (forward fill) 方法可以使用前一个非空值进行填充,bfill (backward fill) 方法可以使用后一个非空值进行填充,例如使用前一个非空值进行填充:
```python
import pandas as pd
# 读取 csv 文件
df = pd.read_csv('file.csv')
# 使用 ffill 方法将空值填充为前一个非空值
df.fillna(method='ffill', inplace=True)
# 将处理后的数据写入新的 csv 文件
df.to_csv('new_file.csv', index=False)
```
3. 使用 interpolate() 方法进行插值
interpolate() 方法可以对缺失值进行插值,例如使用线性插值:
```python
import pandas as pd
# 读取 csv 文件
df = pd.read_csv('file.csv')
# 使用 interpolate 方法进行线性插值
df.interpolate(method='linear', inplace=True)
# 将处理后的数据写入新的 csv 文件
df.to_csv('new_file.csv', index=False)
```
以上是常用的几种方法,根据具体的需求可以选择不同的填充方式。
阅读全文