Python绘图:箱线图,设q1=5%,q2=50%,q3=90%
时间: 2024-09-16 21:03:04 浏览: 48
箱线图,也称为盒须图或Whisker plot,是一种常用的数据可视化工具,用于展示一组数据的分布情况,特别是中位数、四分位数以及异常值。在Python中,我们可以使用matplotlib库来创建箱线图。这里提到的q1(第一四分位数),是指将数据从小到大排列后处于中间位置的25%数据点;q2(第二四分位数),即中位数,是一半数据点位于其下一半,另一半位于其上的一条分割线;q3(第三四分位数)则是剩余75%数据点的上限。
例如,如果你有一个名为data的列表,你可以按照以下步骤绘制箱线图:
```python
import matplotlib.pyplot as plt
# 假设data是一个包含数值的列表
data = [数值1, 数值2, ...]
# 计算q1, q2, q3
q1 = np.percentile(data, 25) # 第一四分位数
q2 = np.percentile(data, 50) # 中位数
q3 = np.percentile(data, 75) # 第三四分位数
# 创建箱线图
plt.boxplot(data)
plt.axhline(q1, color='black', linestyle='-', label=f'Q1={q1}')
plt.axhline(q2, color='red', linestyle='-', label=f'Median={q2}')
plt.axhline(q3, color='black', linestyle='-', label=f'Q3={q3}')
# 添加标题和标签
plt.title('Box Plot Example')
plt.ylabel('Value')
plt.legend()
# 显示图形
plt.show()
```
在这个例子中,黑色线代表Q1,红色线代表中位数,另一根黑色线代表Q3。异常值通常由箱体之外的线表示出来,如果数据中有超过Q1-1.5(IQR)或Q3+1.5(IQR)的值,则会被认为是异常值,其中IQR是四分位距,等于Q3-Q1。
阅读全文