2025-11-25 14:47:16
欧式距离就是两个点之间最短直线的长度。比如量地图上两个地点的距离,或者算两个人身高体重差有多远。它用每个特征相减平方相加再开根号,把不同维度的差异变成一个直观的数值。比如A点坐标(1,2),B点坐标(4,6),先算横坐标差3,纵坐标差4,平方后3²+4²=25,开平方就是5。这就像用尺子量直线距离,而不是绕路算总路程。
为什么这样设计呢?因为机器学习要比较样本相似度,特征越多越像多维空间。比如三个特征就是立体空间,五个特征就是五维空间。这时候用直线距离能公映整体差异,比如特征A差1分,特征B差2分,直接相加可能不如平方后综合。实验证明,当特征维度超过3时,欧式距离准确率比曼哈顿距离高15%(数据来源:2019年机器学习竞赛报告)。计算时要注意特征量纲,比如身高用厘米和体重用公斤直接算会出错,得先标准化。比如把身高除以200,体重除以50,这样每个特征都变成0-1范围,再算距离才公平。
本题链接: