数据挖掘盒状图怎么画
时间: 2024-05-24 09:09:00 浏览: 101
数据挖掘盒状图(Box Plot),也称为箱型图,是一种用于展示一组数据分布情况的可视化方式。下面介绍如何画数据挖掘盒状图:
1. 首先,需要准备一组数据。这些数据可以是一个样本中的观测值,也可以是不同样本之间的比较值。
2. 然后,按照数据的大小顺序排列,确定数据的最小值、下四分位数、中位数、上四分位数和最大值。其中,四分位数是指将所有数据分成四个等份,每份包含25%的数据。
3. 根据上述统计量,画出盒状图。盒状图由五部分构成:最小值、下四分位数、中位数、上四分位数和最大值。中位数通常用一条横线表示,而盒子则用两条竖线和一条横线表示。盒子的上边界为上四分位数,下边界为下四分位数。盒子内部的线条表示中位数。盒子外部两条线条则为最小值和最大值。
4. 如果有异常值,则将其表示在图表之外,通常用圆点或星号表示。异常值是指与其他观测值相比较特别小或特别大的观测值。
下面给出一个示例,假设有以下数据:2, 4, 5, 6, 7, 9, 12, 13, 14, 15, 17, 18, 19, 20。
首先,按照大小排序,得到最小值为2,最大值为20,中位数为13,下四分位数为7,上四分位数为18。
然后,在画布上画出一条水平线段表示中位数13,在这条线段上方画一个长方形,表示下四分位数7到上四分位数18之间的数据。在这个长方形上下方分别画两条直线,表示最小值2和最大值20。如果存在异常值,则在图表之外标注。
阅读全文