2025-11-20 05:56:32
马氏距离和普通距离不一样,它专门算数据之间的“标准化距离”。比如两个苹果店卖苹果和橘子,普通距离只看价格差,马氏距离还会考虑顾客买苹果和橘子时通常会一起买其他水果,这样算出来的距离更准确。
为什么这样设计呢?因为数据分布不是孤立的,比如身高和体重有相关性(高个子通常更重),这时候直接用欧氏距离会误导判断。假设100个成年人的身高和体重数据,协方差矩阵显示身高和体重的相关系数是0.6,当用马氏距离算A点(180cm/70kg)和B点(170cm/60kg)时,先算差值(10cm/10kg),再乘以协方差矩阵的逆矩阵,开平方。结果会比普通距离小14%,说明考虑相关性后A和B更接近。但若协方差是0(身高体重无关),马氏距离就等于普通距离。所以这个公式既保留了距离的直观,又自动调整了数据间的隐藏关系。
本题链接: