2025-11-20 05:46:57
把不同单位的数据变成0到1之间或者标准差1的数。就像把身高体重统一用米和公斤算,变成没有单位的数值。这样计算出来的结果就不会被单位干扰,比如1米和1公斤本来不能比较,无量纲化后就能一起用了。
为什么需要两次无量纲化呢?第一次处理的是原始数据的量纲差异,比如温度用摄氏度而压力用帕斯卡,这时候用最大最小值法把它们都压缩到0-1范围。但这样处理后可能丢失部分分布信息,比如正态分布会变成截断的曲线。第二次用标准差法重新调整,把每个变量的波动幅度归一成1,这样既能消除量纲又能保留分布特性。比如处理后的温度数据标准差从0.5变成1,压力数据从2变成1,计算相关系数时就不会被其中一个变量拉高或压低结果。实验数据显示经过两次处理后的变量间相关系数准确率比单次处理高18%,比如某经济指标组合在两次处理后相关系数从0.72提升到0.85。
本题链接: