pandas清洗带问号的异常值
时间: 2023-07-09 18:49:02 浏览: 213
python实现数据清洗(缺失值与异常值处理)
5星 · 资源好评率100%
如果你的数据中包含了带有问号的异常值,可以使用 pandas 中的 replace() 方法将其替换成 NaN 值,然后再使用 dropna() 方法删除这些 NaN 值所在的行或列。
例如,假设你的数据 DataFrame 名称为 df,其中包含了一个名为 'col_name' 的列,其中带有问号的异常值需要清洗。你可以使用以下代码来清洗异常值:
```
import pandas as pd
# 将异常值替换成 NaN 值
df['col_name'] = df['col_name'].replace('?', np.nan)
# 删除包含 NaN 值的行或列
df = df.dropna()
```
这样,带有问号的异常值就被成功清洗掉了。如果你只想删除包含异常值的行或列,可以使用 dropna() 方法的 subset 参数指定需要检查的列。例如,如果你只想删除 'col_name' 列中包含异常值的行,可以使用以下代码:
```
df = df.dropna(subset=['col_name'])
```
阅读全文