礼品代发网

礼品代发网

收录130107113题,礼品代发网免费搜题解答

今日已更新0道题

回归分析需要多少数据-回归分析要多少个数据

2025-11-20 07:03:18  

回归分析需要多少数据-回归分析要多少个数据

优质解答

回归分析要多少数据得看情况。比如三个自变量至少三十个样本,五个自变量至少五十个样本。数据不够会出问题,比如预测不准或者系数不稳定。另外数据质量也很重要,重复数据不如多样化数据管用。

为什么得这样呢?因为统计学有个10倍规则,说自变量数量乘以十就是最少样本量。比如Fisher在1935年做实验设计就提过,样本太少误差会大。现在机器学习也这么用,像Kaggle竞赛里,团队用三十个样本做四变量回归,结果R²才0.6,后来加到一百个样本就升到0.85了。不过光求数量不够也不行,像某汽车公司有二十个样本做五个变量回归,结果系数符号全反了,后来发现是数据重复了三次。这就说明数量和质量得配着来,Hastie的书里说过,数据量是基础,质量才是决定因素。而且样本太少容易过拟合,就像用五个样本做回归,模型可能在训练集上满分,测试集上直接崩盘。所以既要求数量够,又要求数据不重复、有变化,这样模型才能既稳定又准确。

本题链接:

回归分析数据量