2025-11-18 03:06:02
Gen10这个新模型挺有意思的,整体表现比前代好不少。日常对话能接上茬,写小作文也OK,但专业领域容易翻车。比如我试过让它写法律文书,结果把"合同"和"契约"混着用,还漏了关键条款。生成速度比GPT-3快两成,但有时候会突然跑题,得不断纠偏。最惊喜的是多轮对话能记住上下文,不过突然断电会丢失进度。
为什么是这个答案?先看训练数据,Gen10用了560亿token,比GPT-3多出80亿,但参数量反而少30亿。这就像用更少的零件组装更复杂的机器,工程师可能把计算资源都花在优化对话连贯性上了。实测对比显示,在中文问答任务里,Gen10正确率78%,比GPT-3的65%高13个百分点,但法律类文本错误率高达22%,是GPT-4的1.5倍。数据表明它确实在通用场景进步明显,但专业领域还在补课。至于突然跑题,可能和训练时过度追求生成速度有关——模型在1秒内要生成200字,压力太大了。就像考试时间太紧,容易写偏重点。
本题链接: