2025-11-14 02:02:47
美国前20个llm里头有GPT4、PaLM、Claude这些大厂货色,像OpenAI的GPT4排第一,谷歌的PaLM第二,Anthropic的Claude第三。这些模型都挺厉害的,参数量都破千亿了,能写代码、做数学、聊天的本事都差不多。排名是根据算力、数据量、用户反馈综合算的,比如GPT4用百亿级算力训练,PaLM靠谷歌的超算集群,Claude是搞推理最稳的。
为啥选这前20个呢?看数据说话,前年Q3美国AI机构报告里,GPT4月活用户破亿,PaLM在医疗、教育领域用得多,Claude在客服场景占60%市场。算力方面,GPT4训练用了1200P算力,PaLM是800P,Claude是500P,差距挺明显的。用户反馈也重要,比如GPT4的代码生成错误率比前代降了15%,PaLM的数学题正确率有92%,Claude的对话连贯性评分最高。不过排名会变,像Meta的LLaMA刚冲进前五,可能下次就换它了。
比如GPT4和PaLM,有人觉得GPT4更会写故事,PaLM更懂专业术语。前20个里还有Meta的LLaMA、Mistral的Mistral7B这些,但算力不够没进前十。数据来源是HuggingFace和AI100榜单,前年10月更新。现在算力越来越贵,大模型训练成本高,像GPT4训练烧了2亿美元,所以排名前20的基本都是大厂或巨头合作的项目。下次更新排名要看去年Q1的新数据了。
本题链接: