2025-11-08 11:02:14
数理统计里的维数就像分苹果的格子数,把数据按不同特征分到各个格子里面。比如记录人的身高体重和年龄,这就是三维数据。z值是数据点离平均值的距离除以标准差,相当于用标准差当尺子量距离。比如说身高150cm的人,如果平均身高是170cm,标准差是10cm,那他的z值就是-2,说明比平均矮两个标准差。
为什么用z值来算维数呢?因为每个维度的数据都可能有自己的平均和标准差,用z值能统一比较不同维度的数据大小。比如身高和体重都是厘米单位,但平均身高170cm,体重60kg,直接比较没意义。算完z值后,身高-2和体重0.5,就能看出身高差异更大。根据正态分布数据,z值绝对值超过3的只有0.3%数据,所以z值能快速筛选异常值。比如某次考试平均分75分标准差5分,得90分的人z值是3,说明他成绩特别突出。而如果同时有z值-3的分数,那说明存在明显失误或者题目难度异常。这种标准化处理让不同维度的数据能放在一起比较,就像把苹果和橘子都切成相同大小的块再称重量一样公平。
本题链接: