异常值检验代码
时间: 2023-07-09 22:17:57 浏览: 93
以下是一个简单的异常值检验代码示例,使用了Tukey的箱线图方法:
```python
import numpy as np
import matplotlib.pyplot as plt
def detect_outliers(data, threshold=1.5):
q1, q3 = np.percentile(data, [25, 75])
iqr = q3 - q1
lower_bound = q1 - (iqr * threshold)
upper_bound = q3 + (iqr * threshold)
outliers = np.where((data > upper_bound) | (data < lower_bound))
return outliers
# 生成一些随机数据
data = np.random.normal(0, 1, 1000)
# 检测异常值
outliers = detect_outliers(data)
# 输出异常值
print("Outliers:", data[outliers])
# 绘制箱线图
plt.boxplot(data)
plt.show()
```
这段代码首先定义了一个`detect_outliers`函数,它接受一个数据数组和一个阈值参数,返回一个包含异常值的索引数组。这个函数使用了Tukey的箱线图方法来检测异常值。
然后我们生成了一些随机数据,并调用`detect_outliers`函数来检测异常值。最后,我们输出了检测到的异常值,并绘制了数据的箱线图。
请注意,这只是一个简单的示例代码,并且在实际应用中可能需要更复杂的方法来检测异常值。
阅读全文