异常值识别 箱型图代码
时间: 2023-09-29 15:07:22 浏览: 90
箱型图(Box Plot)是一种常用的数据可视化工具,用于展示一组数据的分布情况,包括数据的中位数、四分位数、异常值等信息。以下是使用Python绘制箱型图的示例代码:
```python
import numpy as np
import matplotlib.pyplot as plt
# 生成随机数据
data = np.random.normal(size=100)
# 添加异常值
data[10] = 10
data[20] = -10
# 绘制箱型图
fig, ax = plt.subplots()
ax.boxplot(data, notch=True)
# 添加标题和横轴标签
ax.set_title('Box plot of data')
ax.set_xlabel('Data')
# 显示图形
plt.show()
```
在上述示例中,我们首先使用numpy生成了100个随机数据,并手动添加了两个异常值。然后,我们使用matplotlib绘制了这组数据的箱型图,并添加了标题和横轴标签。最后,我们调用show()方法显示图形。
在绘制箱型图时,我们可以使用boxplot()函数。该函数可以接受多组数据,绘制多个箱型图。如果想要同时绘制多个箱型图,只需将多组数据传递给boxplot()函数即可。
箱型图的绘制方法使用的是四分位距(IQR)方法,将数据分为四个部分,分别是最小值、第一四分位数(Q1)、中位数(Q2)和第三四分位数(Q3),箱子的高度为Q3-Q1,箱子上下两端的线段称为“须”,须的长度不超过1.5倍IQR,超过该长度的数据点被视为异常值,用圆点标出。
阅读全文