首页dataframe去除离群点

dataframe去除离群点

时间: 2023-12-03 14:38:55 浏览: 66

以下是一种去除DataFrame中离群点的方法： ```python import pandas as pd import numpy as np def remove_outliers(df, column): q1 = df[column].quantile(0.25) q3 = df[column].quantile(0.75) iqr = q3 - q1 lower_bound = q1 - 1.5 * iqr upper_bound = q3 + 1.5 * iqr df = df[(df[column] >= lower_bound) & (df[column] <= upper_bound)] return df ``` 其中，参数df为DataFrame，column为需要去除离群点的列名。该方法使用四分位数（Q1、Q3）和四分位距（IQR）来计算离群点的上下界，然后将DataFrame中在上下界之外的行删除。

阅读全文