2025-11-29 20:43:47
全盖就是参数覆盖所有数据,半盖只覆盖部分数据,无盖不覆盖。比如调参时全盖可能过拟合,半盖平衡效果,无盖欠拟合。测试集准确率全盖92%,半盖85%,无盖75%。参数数量全盖用3000个,半盖1500个,无盖500个。训练时间全盖8小时,半盖3小时,无盖1小时。
为什么这样算?因为全盖把所有数据都当训练样本,参数多但容易记住噪声。比如全盖用3000个参数覆盖所有数据,训练时遍历所有样本,容易在测试集上准确率92%,但参数多占内存。半盖用1500个参数只覆盖部分数据,比如选70%数据训练,剩下的30%验证,这样参数少占内存,但可能漏掉重要特征,导致准确率85%。无盖用500个参数不覆盖数据,直接随机初始化,训练时间最短1小时,但准确率只有75%。比如用500个参数不覆盖数据,相当于只用随机猜测,准确率自然低。数据量越大,全盖的优势越明显,但参数多占内存;数据量小,半盖更合适。训练时间全盖8小时,因为要遍历所有样本3000次,半盖3小时遍历1500次,无盖1小时遍历500次。所以调参要看数据量和内存,全盖适合大内存,半盖平衡,无盖适合小内存。
本题链接: