商汤发布“日日新SenseNova 5.0”大模型,性能对标GPT-4 Turbo

AI最新资讯6个月前发布 tree
90 0 0

今日应用


今日话题


商汤发布“日日新SenseNova 5.0”大模型,性能对标GPT-4 Turbo
商汤发布“日日新SenseNova 5.0”大模型,性能对标GPT-4 Turbo
 

重点标签 tag1AIGC社区tag2大语言模型tag3商汤科技tag4日日新5.0tag5多模态能力

文章摘要


商汤科技在AIGC领域取得显著进展,发布了行业首个“云、端、边”全栈大模型产品矩阵,以满足不同行业的场景化需求。全新发布的“日日新SenseNova 5.0”大模型拥有6000亿参数,在多个基准测试平台中表现出色,超过或接近OpenAI的GPT-4Turbo,全面超过Meta的Llama-3 70B。商汤科技股价因此大涨,成为国内AIGC领域的一支“妖股”。

日日新5.0模型的技术亮点包括采用混合专家架构(MoE),激活少量参数即可完成推理,上下文窗口高达200K左右。此外,其训练数据超过10TB tokens,覆盖数千亿量级的逻辑型合成思维链数据。在商汤AI大装置SenseCore算力设施与算法设计实现联合调优下,日日新5.0多模态能力达到全球领先水平,在多模态大模型权威综合基准测试MMBench中综合得分排名首位。

商汤科技还推出了日日新·端侧大模型,性能实现同等尺度性能最优,跨级尺度全面领先。端侧大语言模型的推理速度达到业内最快,中端平台实现18.3字/s的平均生成速度,旗舰平台达到78.3字/s。扩散模型在端侧实现业内最快的推理速度,支持输出1200万像素及以上的高清图片。

商汤科技与金山办公、海通证券、小米、阅文集团、华为等生态伙伴共同探讨大模型技术在办公、金融、出行等不同领域的应用及前景。金山办公CEO章庆元表示,商汤大模型在办公应用场景内表现十分出色,能够帮助用户解决办公中的复杂问题,提升效率。小米集团小爱总经理王刚表示,商汤的云边端全栈组合可以很好地赋能和适配小米物联网生态。

商汤科技2023年年报显示,公司全年实现营收34亿元,毛利润为15亿元,毛利率44%。生成式AI项目取得11.84亿元人民币的收入,增幅达200%,占公司总收入之比由2022年的10.4%提升至34.8%。商汤科技与联通、电信、移动、招商银行、海通证券、京东、小米、阅文集团等头部企业合作,同时与清华大学、上海交大等名校保持技术合作关系。2024年,商汤科技将重点发展生成式AI、传统AI和智能汽车三大业务板块。

文章来源


原文地址: 点我阅读全文
原文作者: AIGC开放社区

© 版权声明

相关文章

暂无评论

暂无评论...