标签:开源
国内最大MoE开源大模型来了,还基于此搞出个火遍港台的AI聊天应用
机器之心报道了元象XVERSE发布的中国最大的MoE(Mixture of Experts)开源模型——XVERSE-MoE-A36B。这一模型拥有255B的总参数和36B的激活参数,实现了在不显著...
详聊LLaMa技术细节:LLaMA大模型是如何炼成的?
极市导读:本文介绍了 Meta AI 推出的 LLaMa 模型,这是一种开源的大语言模型,与 OPT 类似。LLaMa 模型的参数量级从 7B 到 65B 不等,且在数万亿个 token 上...
检索总结能力超博士后,首个大模型科研智能体PaperQA2开源了
AI 科学家的研究逐渐增多,大语言模型(LLM)在帮助科学家检索、综合和总结文献方面显示出巨大潜力。然而,其在研究工作中的使用仍存在诸多限制,如事实性错...
开源启动!18个月Llama系列下载量近3.5亿,黄仁勋:快到难以置信
Meta与AWS、微软Azure、Databricks等公司合作,推动Llama模型的潜力。Llama 3.1发布后,Meta的主要云服务供应商的Llama使用量显著增长。此外,Llama在Hugging...
Demis Hassabis:人类的未来是实现 AGI 自由的未来
Demis Hassabis 对 AI 的看法Hassabis 在播客中分享了他对 AI 行业的复杂情感。他一方面怀念过去 AI 尚未受到太多关注时的宁静,另一方面,他也认可现在的关...
性能秒杀SD3、DALL·E-3,开源文生图模型杀出大黑马
FLUX.1,一个在AIGC领域引起广泛关注的开源大模型,由Robin Rombach创立,其性能在多个方面超越了DALL·E-3、Midjourney V6等知名模型。Robin Rombach是扩散模...
万亿token!史上最大多模态数据集诞生
华盛顿大学、Salesforce Research和斯坦福大学等机构的联合团队发布了一个名为MINT-1T的万亿token级开源多模态数据集,旨在推动多模态大模型(LMM)的发展。...
听说,Stable Diffusion 3 人物生成大翻车了?|直播预告
Stable Diffusion 3(稳定扩散3)是一款基于Diffusion Transformer架构的图片生成模型,四个月前发布后引起了广泛关注。然而,尽管模型开源让许多人期待,但...
GLM-4开源版本终于来了:超越Llama3,多模态比肩GPT4V,MaaS平台也大升级
智谱AI在AI开放日上公布了一系列行业落地的数字,显示了其大模型的快速发展和广泛应用。公司已经获得了30万注册用户,并且日均调用量达到了400亿Tokens。这一...
前特斯拉Optimus科学家跳槽HF,直接开源了一个机器人代码库
步骤2:撰写摘要总结Hugging Face,一家以构建大型开源社区而闻名的 AI 初创公司,最近开源了 LeRobot 机器人工具包,这为 AI 机器人研发带来了重大利好。LeR...