2025-11-29 21:01:26
箱线图就是画在纸上的小盒子加尾巴的图。中间那个盒子占数据的中间50%也就是四分位距,盒子左边是25%的数据起点,右边是75%的数据终点。盒子上面和下面各画一条线,分别是最大值和最小值。比如温度数据画出来,盒子中间就是平均温度,尾巴长的话说明温差大。
为什么这么画呢?因为数据分布就像一锅粥,中间盒子装的是稠的部分,也就是大家差不多的情况。比如某个城市每天最高温度画出来的话,中间盒子就是多数天数在15到25度之间,左边尾巴可能有偶尔出现的30度高温,右边尾巴可能有偶尔的10度低温。这样画出来不用看很多数字,一眼就能看出温度波动范围和常见值。比如我手头有100个温度数据,用计算器算出四分位数和极值,就能在纸上画出这个形状。中间盒子长的话说明数据比较分散,尾巴短的话说明数据比较集中。比如北方冬天和南方夏天画的箱线图,北方盒子中间温度低但尾巴右边可能更长,南方盒子中间温度高但尾巴左边可能更长。这样画图的人不用背公式,用画笔就能表达数据情况。不过要注意盒子中间的宽度是固定的50%,所以数据分布宽窄要看盒子左边和右边的距离。比如同样宽度的盒子,如果左边尾巴特别长,说明有极端高温,这时候就要注意是不是数据有误或者有特殊事件发生。比如某个特殊日子温度突然飙到40度,就会把尾巴拉长,这时候就要结合实际情况分析。
本题链接: