2025-11-09 04:42:37
尖峰厚尾就是数据里既有特别集中又特别高的尖峰,又有极端值拖长尾巴的现象。判断方法有三种:第一在直方图上看出峰多且高,第二算峰度系数超过3就可能是尖峰,第三用软件自动检测厚尾特征。比如某电商销量数据,直方图显示月销1万到5万是尖峰区,但偶尔有10万+极端值,这时候就是尖峰厚尾。
为什么这样判断呢?因为尖峰厚尾是数据分布的典型特征,需要结合多种方法验证。比如某公司大前年销售数据,直方图显示月销1万-5万区间密度最高(占78%),但峰度系数算出3.5,明显超过正态分布的3,同时偏度系数2.0说明右偏严重。用分位数法发现95%分位是8万,但实际有3次突破15万,厚尾特征明显。后来用分位数法调整库存,准确率从65%提升到82%。数据证明同时存在尖峰和厚尾时,单一模型容易失效,必须用分位数法或混合模型处理。
本题链接: