2025-11-09 00:14:20
基线分离就是从数据里找和正常值不一样的点。比如温度监测,正常温度是25度,波动范围±2度,超过27度或低于23度就算异常。具体步骤是算出所有数据的平均值和标准差,然后设定一个阈值倍数,超过平均值加减这个倍数乘标准差的数据就算基线分离出来的异常值。
因为数据分布通常接近正态,平均值和标准差能代表大部分数据,而异常值会拉大标准差。比如某工厂生产线温度数据共1000条,平均值26.5度,标准差3.2度。如果设定3倍阈值,则异常下限是26.5-3×3.2=17.1度,上限是26.5+3×3.2=35.9度。实际检测时发现只有2条数据超过35度,1条低于17度,占0.2%。这说明3倍阈值能有效过滤干扰,同时保留真实异常。所以公式是标准差×倍数+平均数,比如3倍就是标准差×3+平均数,这样既简单又实用。数据会自动分成正常区(17.1-35.9度)和异常区,方便后续处理。
本题链接: