pandas读取csv数据集显示 NaN怎么处理
时间: 2023-07-31 07:10:59 浏览: 1445
当 Pandas 读取 CSV 数据集时,如果某些行或列缺少数据,就会显示 NaN(Not a Number)。
处理 NaN 的方法有:
1. 删除包含 NaN 的行或列:使用 `dropna()` 方法。
2. 用固定值替换 NaN:使用 `fillna()` 方法。
3. 插值法填充 NaN:使用 `interpolate()` 方法。
4. 使用均值、中位数等代替 NaN:使用 `fillna()` 方法结合 `mean()`、`median()` 等方法。
具体的实现方法如下:
1. 删除包含 NaN 的行或列:
```python
import pandas as pd
# 读取 csv 文件
df = pd.read_csv('data.csv')
# 删除包含 NaN 的行
df = df.dropna()
# 删除包含 NaN 的列
df = df.dropna(axis=1)
```
2. 用固定值替换 NaN:
```python
import pandas as pd
# 读取 csv 文件
df = pd.read_csv('data.csv')
# 用固定值 -1 替换 NaN
df = df.fillna(-1)
```
3. 插值法填充 NaN:
```python
import pandas as pd
# 读取 csv 文件
df = pd.read_csv('data.csv')
# 对包含 NaN 的列使用插值法填充 NaN
df = df.interpolate()
```
4. 使用均值、中位数等代替 NaN:
```python
import pandas as pd
# 读取 csv 文件
df = pd.read_csv('data.csv')
# 用平均值替换 NaN
df = df.fillna(df.mean())
```
阅读全文