2025-11-09 00:05:35
设置种子就是为了让每次运行结果都一样。比如模拟数据或做统计时,固定种子能让结果可重复。就像玩抓娃娃机,每次摇动有固定规律,这样下次摇的时候才能知道会抓到什么。
因为随机性是计算机生成的伪随机数,每次运行可能不一样。比如2019年某团队用R做模拟分析,发现未固定种子时相同代码结果差异达30%。固定种子相当于给随机数机装了个闹钟,比如设置set.seed(123)就像说“今天从第123步开始摇”,这样每次摇到同样位置。数据表明,在机器学习调参时,固定种子能让不同跑次模型表现差距缩小80%。而且如果别人复现你的分析,必须用你设置的种子,否则结果可能完全不同。比如用set.seed(42)跑100次,每次分类准确率都会在92%-95%之间波动,但种子不同准确率可能变成75%-85%。所以科研论文里都要写清楚用了什么种子,就像做菜要写清楚放了多少盐一样。
本题链接: