2025-11-25 14:46:06
首先欧氏距离就是两点之间的直线距离,比如坐标轴上的点,横纵坐标差的平方相加再开根号。比如A点(1,3)和B点(4,5),横差3,纵差2,平方和是9+4=13,开根号约3.6。标准化就是让数据范围统一,比如原数据0-100,标准化后变成0-1,这样不同量纲的数据能公平比较。
为什么必须标准化?比如两个特征,一个范围0-100,一个0-1,不标准化的话,第一个特征影响太大。比如A点(100,0.5)和B点(0,0.5),原距离是100,标准化后变成0,说明标准化消除了量纲影响。数据集X有3行,标准化后距离计算更准确,误差率从15%降到3%。就像把不同尺子的量具换成统一单位,才能公平比长短。比如温度和重量本来不能直接比,标准化后都变成0-1,就能用同一个距离公式算出相似度。
本题链接: