今日应用
今日话题
阿里Qwen-2成全球开源大模型排行榜第一,中国处于领导地位。
重点标签 开源大模型、AIGC、Qwen2-72B、Hugging Face、市场研究
文章摘要
开源大模型领域迎来新突破,阿里的Qwen2-72B指令微调版本在Hugging Face的开源模型排行榜中夺得第一名。这一成就标志着中国在全球开源大模型领域的领导地位。Hugging Face联合创始人Clem在社交平台上宣布了这一消息,并解释了重新评估的原因:开发者在训练过程中过度依赖排行榜名次,并使用评估集数据,导致之前的评估流程过于简单。为了更准确地评估模型实力,Hugging Face使用了300块H100芯片对全球100多个主流开源大模型进行了全新评估。
在新的排行榜中,Meta的Llama-3-70B指令微调版本位列第二,阿里的Qwen2-72B基础版本排名第三,而Mistralai的Mixtral-8x22B指令微调版本排名第四。微软的小参数模型Phi-3-Medium-4K 14B排名第五,显示出小参数模型经过高质量数据集预训练后,也能实现与大参数模型相媲美的能力。此外,中国零一万物的Yi-1.5-34B-Chat版本和Cohere的Command R+ 104B分别位列第六和第七,而英伟达的Smaug-72B-v0.1则跌至第八名。
StabilityAI的研究总监Tanishq表示,中国在开源大模型领域具有极强的竞争力,除了Qwen2外,还有零一万物、InternLM、Deepsseek等知名开源模型。他强调,中国在这一领域并非落后,而是处于领导者地位。阿里Qwen-2的优异表现令人惊讶,但也在情理之中。业界期待Meta发布新模型与Qwen2展开竞争。
此外,Qwen2-72B的指令微调版本在ElyzaTasks100性能评测中表现突出,仅次于OpenAI的GPT-4o,高于谷歌的Gemini1.5Pro。在与OpenAI、Anthropic等闭源大模型平台的PK中,Qwen2-72B也展现出了强大的实力,成为中国唯一进入美国评估标准前10的公司。
阿里在开源大模型领域的成就令人瞩目,期待未来能发布更多高性能的开源模型,为全人类带来福祉。