pandas 查nan值
时间: 2024-09-12 19:10:20 浏览: 51
pandas是一个强大的Python数据分析库,它提供了大量的数据处理功能。在pandas中,可以通过以下方法查找和处理含有NaN值的数据:
1. `isnull()` 和 `notnull()` 方法:这两个方法可以返回一个布尔型的DataFrame或Series,其中的True表示对应位置的数据是NaN,False表示不是。例如:
```python
import pandas as pd
import numpy as np
df = pd.DataFrame({
'A': [1, 2, np.nan],
'B': [4, np.nan, np.nan],
'C': [7, 8, 9]
})
print(df.isnull()) # 显示DataFrame中的NaN位置
print(df.notnull()) # 显示非NaN的位置
```
2. `dropna()` 方法:此方法可以删除包含NaN的行或列。例如:
```python
df_dropped = df.dropna() # 删除含有NaN的行
df_dropped_column = df.dropna(axis=1) # 删除含有NaN的列
```
3. `fillna()` 方法:可以用来填充DataFrame中的NaN值。你可以选择用特定的值填充,也可以使用前一个非NaN值、后一个非NaN值或者使用插值方法填充。例如:
```python
df_filled = df.fillna(0) # 用0填充NaN值
df_filled_forward = df.fillna(method='ffill') # 向前填充NaN值
```
4. 直接查询含有NaN的行或列:
```python
nan_rows = df[df.isnull().any(axis=1)] # 获取含有NaN值的行
nan_columns = df.columns[df.isnull().any()] # 获取含有NaN值的列
```
通过这些方法,可以轻松地识别和处理pandas DataFrame中的NaN值。
阅读全文