标签:大语言模型
详聊LLaMa技术细节:LLaMA大模型是如何炼成的?
极市导读:本文介绍了 Meta AI 推出的 LLaMa 模型,这是一种开源的大语言模型,与 OPT 类似。LLaMa 模型的参数量级从 7B 到 65B 不等,且在数万亿个 token 上...
LLM 系列超详细解读 (十)|大语言模型中的超大激活值
本文深入探讨了大语言模型(LLM)中出现的“超大激活值”现象,这种现象指的是在模型的激活值中,有极个别值远大于其他值,差异可达100,000倍。作者首先分析了...
明确了:文本数据中加点代码,训练出的大模型更强、更通用
在大语言模型(LLM)的研究中,代码数据的重要性日益凸显。Cohere等机构提交的最新研究系统地探讨了代码数据对通用大模型性能的影响。研究者发现,代码数据不...
性能秒杀SD3、DALL·E-3,开源文生图模型杀出大黑马
FLUX.1,一个在AIGC领域引起广泛关注的开源大模型,由Robin Rombach创立,其性能在多个方面超越了DALL·E-3、Midjourney V6等知名模型。Robin Rombach是扩散模...
杀疯了!Meta开源SAM-2:可商用,随意分割视频、图像
Meta公司在AIGC领域取得了显著进展,特别是在视觉分割技术方面。2023年4月5日,Meta首次开源了SAM(Segment Anything Model),一个能够根据交互和自动化方式...
Sam Altman:为防止中国超越,美国应加强AI的4大投入
Sam Altman,OpenAI的联合创始人兼首席执行官,在华盛顿邮报发表文章《Who will control the future of AI?》,探讨AI的未来发展和控制权问题。他认为,掌握A...
OpenAI发布最新大模型安全对齐奖励方法——RBR
随着AIGC领域的发展,大语言模型(LLM)如ChatGPT在应用落地中,安全性成为关键问题。传统RLHF方法存在数据更新成本高和标注者偏见等问题。为此,OpenAI提出...
类ChatGPT平台Cohere获5亿美元融资,估值55亿美元
Cohere,一家专注于AIGC领域的大模型平台,于7月22日晚宣布完成了5.5亿美元的D轮融资,其估值达到了55亿美元。此次融资由加拿大养老金投资管理公司PSP Invest...
HerculesAI获2600万美元融资,为律师提供AI Agent服务
HerculesAI,一家专注于AIGC领域并致力于大语言模型(LLM)应用落地的智能自动化平台,近期宣布成功获得2600万美元的B轮融资。此次融资由Streamlined Venture...
微软发现“万能钥匙”,成功入侵GPT-4o、Claude 3
微软Azure首席技术官Mark Russinovich在其官网上分享了一种新型的大模型入侵技术——“Skeleton Key”(万能钥匙)。这种技术利用多轮强制和诱导策略,使大模型的...