2025-11-20 05:55:57
因为数据量太小点太密看不清分布所以看起来不全。比如画100个点在1平方厘米里就像100粒芝麻挤在一起根本分不清哪个在哪个位置。横纵坐标范围太窄也会让点堆在一起比如坐标0-10里100个点可能重叠成一片。
爱好者的话得再解释清楚。其实数据量少就像放 few coins 在小盆里,点太密就看不见单个 coins 的位置。比如100个数据点横纵坐标都是0-10,点太挤了重叠严重,像一百个点堆在1平方厘米里,所以根本看不清分布规律。就像用放大镜看蚂蚁窝,密密麻麻的蚂蚁腿都分不清。这时候要么加数据量比如增加到1000个点,要么拉大坐标范围比如变成0-100,让每个点有自己的位置。就像把芝麻撒在大的簸箕里,单个芝麻都能看清。有研究说当数据量低于500时,散点图重叠率超过70%,这时候确实看不清趋势。比如某次统计只用了300个样本,结果所有点都挤在右上角,根本看不出正态分布。所以根本原因就是数据量不够坐标没调好,就像用小碗装大桶水,水都溢出来了还以为碗装满了。
本题链接: