python中dropna
时间: 2023-11-06 08:27:17 浏览: 83
在Python中,`dropna`是一个用于数据清洗的函数,用于删除数据集中的缺失值NaN(Not a Number),即空值。
`dropna`函数可以应用于Pandas的Series和DataFrame数据结构。当应用于Series时,函数将删除该Series中的所有NaN值。当应用于DataFrame时,函数可以删除包含NaN值的行或列。
以下是一个使用`dropna`函数删除DataFrame中包含NaN值的行的示例:
```python
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Ella'],
'age': [25, 30, None, 35, 40],
'gender': ['F', 'M', 'M', 'M', 'F']}
df = pd.DataFrame(data)
print(df)
# Output:
# name age gender
# 0 Alice 25.0 F
# 1 Bob 30.0 M
# 2 Charlie NaN M
# 3 David 35.0 M
# 4 Ella 40.0 F
df = df.dropna()
print(df)
# Output:
# name age gender
# 0 Alice 25.0 F
# 1 Bob 30.0 M
# 3 David 35.0 M
# 4 Ella 40.0 F
```
在上述示例中,原始DataFrame包含一行包含NaN值的记录,当使用`dropna`函数时,该行被删除,返回一个新的DataFrame,不包含该行。
阅读全文