python异常值删除
时间: 2023-09-15 21:20:41 浏览: 137
在Python中,可以使用pandas库来删除异常值。下面是一个简单的例子:
```python
import pandas as pd
import numpy as np
# 创建一个包含异常值的数据集
df = pd.DataFrame({'A': [1, 2, 3, 4, 5, 6],
'B': [10, 20, 30, 40, 50, 600]})
# 定义一个函数来删除异常值
def remove_outliers(df, column, threshold):
"""删除数据集中指定列中的异常值"""
mean = np.mean(df[column])
std = np.std(df[column])
cutoff = std * threshold
lower, upper = mean - cutoff, mean + cutoff
df = df[(df[column] >= lower) & (df[column] <= upper)]
return df
# 删除'B'列中的异常值
df = remove_outliers(df, 'B', 2)
# 打印结果
print(df)
```
在上面的例子中,我们使用了一个自定义的函数 `remove_outliers`,它接受一个数据集、一个列名和一个阈值作为参数。函数通过计算列的平均值和标准差来确定异常值的范围。然后,函数使用这个范围来过滤数据集中的异常值。最后,我们调用这个函数来删除数据集中'B'列中的异常值,并打印结果。
阅读全文