数据可视化箱型图四分位数
时间: 2023-09-18 17:15:30 浏览: 144
matlab代码替换-CategoricalScatterplot:[MATLAB]改进的箱形图,显示数据点以及中位数和四分位数
箱型图(Box plot)是一种用于展示数据分情况的图表。其中,箱体表示数据的四分位数(Q1、Q2、Q3),箱子的顶端和底端分别为上四分位数(UQ)和下四分位数(LQ),箱子内部的线条表示中位数(Median)。箱子上下的两条线称为“触须”(Whisker),通常被定义为小于等于1.5*IQR(四分位距,即Q3-Q1)的最大值和最小值。超出触须的点被视为异常值。
四分位数(Quartile)是指将全部数据按大小顺序排列后分成四等份,处于三个分割点位置的数值,分别是第一四分位数(Q1)、第二四分位数(Q2)和第三四分位数(Q3)。其中,Q2即为中位数。Q1表示全部数据中,前25%的数据所组成的集合的最大值,Q3表示全部数据中,后25%的数据所组成的集合的最小值。
在箱型图中,箱子的高度(或宽度)表示数据的分布情况,箱子越高(或宽),表示数据的变异性越大,也就是说,数据的分布越分散。同时,异常值的存在也能够在箱型图中被直观地看出。
阅读全文