阿里Qwen-2成全球开源大模型排行榜第一，中国处于领导地位。

今日应用

阿里云——阿里巴巴集团旗下公司，是全球领先的云计算及人工智能科技公司之一。提供免费试用、云服务器、云数据库、云安全、云企业应用等云计算服务，以及大数据、人工智能服务、精准定制基于场景的行业解决方案。免费备案，7x24小时售后支持，助企业无忧上云。

今日话题

阿里Qwen-2成全球开源大模型排行榜第一，中国处于领导地位。

重点标签 开源大模型、AIGC、Qwen2-72B、Hugging Face、市场研究

文章摘要

开源大模型领域迎来新突破，阿里的Qwen2-72B指令微调版本在Hugging Face的开源模型排行榜中夺得第一名。这一成就标志着中国在全球开源大模型领域的领导地位。Hugging Face联合创始人Clem在社交平台上宣布了这一消息，并解释了重新评估的原因：开发者在训练过程中过度依赖排行榜名次，并使用评估集数据，导致之前的评估流程过于简单。为了更准确地评估模型实力，Hugging Face使用了300块H100芯片对全球100多个主流开源大模型进行了全新评估。

在新的排行榜中，Meta的Llama-3-70B指令微调版本位列第二，阿里的Qwen2-72B基础版本排名第三，而Mistralai的Mixtral-8x22B指令微调版本排名第四。微软的小参数模型Phi-3-Medium-4K 14B排名第五，显示出小参数模型经过高质量数据集预训练后，也能实现与大参数模型相媲美的能力。此外，中国零一万物的Yi-1.5-34B-Chat版本和Cohere的Command R+ 104B分别位列第六和第七，而英伟达的Smaug-72B-v0.1则跌至第八名。

StabilityAI的研究总监Tanishq表示，中国在开源大模型领域具有极强的竞争力，除了Qwen2外，还有零一万物、InternLM、Deepsseek等知名开源模型。他强调，中国在这一领域并非落后，而是处于领导者地位。阿里Qwen-2的优异表现令人惊讶，但也在情理之中。业界期待Meta发布新模型与Qwen2展开竞争。

此外，Qwen2-72B的指令微调版本在ElyzaTasks100性能评测中表现突出，仅次于OpenAI的GPT-4o，高于谷歌的Gemini1.5Pro。在与OpenAI、Anthropic等闭源大模型平台的PK中，Qwen2-72B也展现出了强大的实力，成为中国唯一进入美国评估标准前10的公司。

阿里在开源大模型领域的成就令人瞩目，期待未来能发布更多高性能的开源模型，为全人类带来福祉。

文章来源

原文地址: 点我阅读全文
原文作者: AIGC开放社区

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

阿里Qwen-2成全球开源大模型排行榜第一，中国处于领导地位。

今日应用

今日话题

文章摘要

文章来源

万文长文搞定检索增强生成(RAG)技术——13篇热门RAG文章解读

开源创新框架MoA，可极大增强大模型的能力

相关文章

暂无评论

热门网址

热门标签