pandas处理异常值和空值
时间: 2023-07-18 09:45:21 浏览: 108
pandas数据的异常值判断、可视化以及异常值的处理
在Pandas中,可以使用以下方法处理异常值和空值:
1. 删除异常值或空值:使用dropna()方法,可以删除包含空值或NaN值的行或列。使用drop()方法,可以删除指定的行或列。
2. 填充空值:使用fillna()方法,可以将空值或NaN值填充为指定的值。可以使用平均值、中位数、众数等方法填充空值。
3. 替换异常值:使用replace()方法,可以将指定的异常值替换为指定的值。可以使用平均值、中位数、众数等方法替换异常值。
例如,可以使用以下代码处理异常值和空值:
```
import pandas as pd
# 创建一个包含异常值和空值的DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, 5, 6],
'B': [10, 20, 30, 40, 50, 60],
'C': [100, 200, 300, None, 500, 600],
'D': [1000, 2000, 3000, 4000, 5000, None]})
# 删除包含空值的行
df = df.dropna()
# 填充空值为0
df = df.fillna(0)
# 替换异常值为平均值
mean = df['D'].mean()
df = df.replace(5000, mean)
```
这样就可以处理DataFrame中的异常值和空值。
阅读全文