2025-11-09 23:29:35
二维正态随机变量就像平面上的两个球,它们的分布中心在均值点,形状像被拉长的椭圆。椭圆的长短轴由两个变量的标准差决定,椭圆的旋转角度由它们的相关性决定。比如身高和体重,身高均值175cm,体重均值70kg,两者相关系数0.8,分布就会偏向身高高的区域。
为什么是这个公式呢?首先得知道一维正态分布是钟形曲线,二维就是钟形曲面。公式里的均值向量给出中心位置,协方差矩阵控制椭圆形状。比如身高和体重数据集,1000组样本计算得出协方差矩阵,主对角线是身高和体重的方差,非对角线是协方差。当协方差为0时椭圆不旋转,说明变量无关。比如身高和鞋码可能协方差为0,分布是正方形,但实际数据可能有微小相关性导致椭圆轻微旋转。公式里的指数部分把距离均值的平方加权求和,权重就是协方差矩阵的逆矩阵,这样能自动调整相关性的影响。比如身高偏差3cm,体重偏差5kg,如果两者强相关,这个偏差会比独立时更大。所以公式里的矩阵运算就像给不同方向的偏差设置不同惩罚系数,用归一化常数确保概率密度总和为1,这就需要计算协方差矩阵的行列式值来确定归一化因子。整个过程就像用数学工具给平面上的数据画一个精准的椭圆边界,椭圆越扁说明相关性越强,越圆说明相关性越弱。
本题链接: