pandas检测异常值代码
时间: 2023-09-11 08:08:16 浏览: 149
异常数据检测
4星 · 用户满意度95%
这里是一个使用pandas进行异常值检测的示例代码:
```python
import numpy as np
import pandas as pd
# 创建一个数据集,包含10个正常值和2个异常值
data = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 100, 200])
# 计算数据集的四分位数
Q1 = np.percentile(data, 25)
Q3 = np.percentile(data, 75)
# 计算四分位距(IQR)
IQR = Q3 - Q1
# 计算异常值的阈值
lower_threshold = Q1 - 1.5 * IQR
upper_threshold = Q3 + 1.5 * IQR
# 找到数据集中的异常值
outliers = data[(data < lower_threshold) | (data > upper_threshold)]
# 输出异常值
print('异常值:', outliers)
```
该代码通过计算数据集的四分位数和四分位距来确定异常值的阈值,然后找到数据集中低于下限或高于上限的值。注意,这只是一个简单的示例,并且可能需要根据不同的数据集进行调整。
阅读全文