dataframe去除离群点
时间: 2023-12-03 14:38:55 浏览: 66
以下是一种去除DataFrame中离群点的方法:
```python
import pandas as pd
import numpy as np
def remove_outliers(df, column):
q1 = df[column].quantile(0.25)
q3 = df[column].quantile(0.75)
iqr = q3 - q1
lower_bound = q1 - 1.5 * iqr
upper_bound = q3 + 1.5 * iqr
df = df[(df[column] >= lower_bound) & (df[column] <= upper_bound)]
return df
```
其中,参数df为DataFrame,column为需要去除离群点的列名。该方法使用四分位数(Q1、Q3)和四分位距(IQR)来计算离群点的上下界,然后将DataFrame中在上下界之外的行删除。
阅读全文
相关推荐









