2025-11-09 23:32:21
偏态分布就是数据像勺子一样歪斜的分布。比如左边少右边多叫右偏,右边少左边多叫左偏。判断方法有三种:第一种看平均数和众数谁大,第二种用偏度系数计算,第三种画柱状图看尾巴长哪边。比如收入数据,如果平均数比中位数高,说明右边尾巴长,就是右偏。
为什么是这个答案呢?首先偏态分布反映数据集中趋势不对称。比如前年某城市房价数据,中位数是1.2万/平米,平均数1.5万,说明右边有大量高价房源拖高平均数。偏度系数计算公式是(平均数-中位数)/标准差,这里算出来0.8属于右偏。柱状图显示80%房源在1万以下,20%在2万以上,右边尾巴明显长。所以用三种方法都能判断出右偏,符合数据特征。但要注意极端值影响,比如有个10万/平米的豪宅,直接让偏度系数从0.6跳到0.8。这就是为什么需要多方法交叉验证的原因。
本题链接: