2025-11-20 05:48:01
最近学统计发现个有趣现象,为啥样本标准差要用n-1除?简单说就像量身高,要是量全班同学算总体标准差,就用n;但量5个同学当样本,n-1就像给这5个同学多留个名额,让结果更接近全班真实情况。比如用5个人身高算样本标准差,用n-1的话,平均数偏差会自动调小,避免把局部波动当整体波动。
其实这是统计学里贝塞尔校正的原理,专门解决样本偏差问题。假设真实总体标准差是10,用n算样本标准差会偏大,用n-1就能缩小误差。比如取3组数据:第一组5人身高差分别是2、4、6、8、10,用n-1算标准差是6.32;如果误用n算就是7.07,明显偏大。第二组10人数据,n-1和n结果差更小,只有0.17。数据越多,n-1和n的差距越小,这就是为啥大样本标准差看不出来区别。而且统计学家通过大量实验验证,n-1确实能让样本标准差成为总体标准差的无偏估计量,就像给新手司机多留个刹车距离,确保安全。
本题链接: