2025-11-20 06:09:27
数据分布就像咱们看一群人的身高,有的高个儿多,有的矮个儿多,分布形状不同。常见的有正态分布像山丘,偏态分布像尾巴长,均匀分布像撒芝麻,分位数分布像梯田,还有混合分布像拼图块。每种形状都说明数据生成规则不同。
为啥是这个答案呢?比如正态分布常见于自然现象,像身高测量数据,中间高两边低像山丘。偏态分布常见收入数据,右边尾巴长说明有人收入特别高。均匀分布像骰子点数,每个数概率均等。分位数分布像考试分数段,把数据分成等份。混合分布像用户年龄,年轻人多中年少老年更多,不同年龄段分布不同。这些例子说明数据分布形态直接反映生成过程,比如收入受政策影响会偏态,骰子公平才会均匀。实际分析时用直方图或核密度图就能看出形状,再结合业务场景判断是否正常。比如电商销量正态分布说明产品受欢迎,偏态分布可能爆款太多。注意数据量少时可能看不准,得用统计检验确认。
本题链接: