今日应用
今日话题
阿里Qwen2正式开源,性能全方位包围Llama-3
重点标签 Qwen2大模型、AI社区、性能飞跃、多语言能力、开源模型
文章摘要
斯坦福团队的套壳清华大模型事件使得中国模型在全球范围内得到了更多关注,人们开始意识到中国在大模型领域已经取得了显著的进展。阿里云通义千问团队的Qwen2大模型开源,吸引了众多AI开发者的兴趣。Qwen2-72B的性能超越了业界知名的Llama3-70B和其他国内闭源大模型,现在所有人都可以在魔搭社区和Hugging Face免费下载该模型。
Qwen2系列包括五种不同尺寸的基础和指令调优模型,所有尺寸的模型都采用了Grouped-Query Attention(GQA),这使得模型在推理加速和显存占用方面具有优势。研究团队还专注于扩展多语言预训练和指令微调数据的规模和质量,提升了模型的多语言能力,尤其是在27种非中英文的语言上进行了增强。
在性能方面,Qwen2-72B在多项能力上超越了当前领先的模型,包括自然语言理解、知识、代码、数学及多语言等。研究团队通过精细的微调提升了模型的智能水平,使其更接近人类的表现。此外,Qwen2-72B-Instruct在16个基准测试中表现优异,取得了与Llama-3-70B-Instruct相匹敌的成绩。
Qwen2系列模型的API已经登陆阿里云百炼平台,为全球开发者提供了更多的选择。这些模型的开源将进一步推动AI技术的发展和应用。
文章来源
原文地址: 点我阅读全文
原文作者: 机器之心
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...