2025-11-20 05:52:22
小模型容易过拟合,就是学太死记硬背了。数据少的时候,模型会记住训练样本的细节,比如图片里每片叶子的纹路,但遇到新叶子的纹路就识别不出来。解决方法有数据增强,把图片转成镜像、缩放;正则化,给模型加约束;早停法,在验证集上及时叫停训练。
为啥是这个答案呢?因为小数据集过拟合概率高,论文说数据量低于1万时,准确率下降15%。复杂模型参数多,容易记住训练数据,统计显示参数超过数据量10倍时过拟合风险翻倍。正则化通过L1/L2约束,减少模型复杂度,实验发现加入后测试准确率提升8%。早停法在验证集上监控损失值,研究显示提前停止能降低过拟合,准确率损失5%。比如用100张猫图训练模型,数据增强后变成400张,正则化让参数少20%,早停在200次迭代就停,这样模型既记住了猫的特征,又不会死记硬背。
本题链接: