标签:LLM

Is Scaling All You Need? LLM收益递减,AI小厂难活命

近日,马库斯的一句「Is scaling all you need?」引发了正反两方的论战。自GPT-4发布以来,尽管有约500亿美元投资在芯片上,但至今仍无模型能超越GPT-4,引发...

Meta等最新研究:多token预测,提升大模型推理效率

多token预测是一种新型的预训练方法,旨在提高大语言模型(LLM)的推理效率。这种方法要求模型在每个位置上同时预测接下来的n个Token,而不是像传统的下一个T...

任意模态输入输出?语音/文本/图像/音乐都拿下! 复旦提出AnyGPT:序列建模的统一多模态 LLM

本文介绍了AnyGPT,一种新型的any-to-any多模态大型语言模型(LLM),由复旦大学和上海AI Lab共同开发。AnyGPT能够统一处理包括语音、文本、图像和音乐在内的...

仅需Llama3 1/17的训练成本,Snowflake开源128x3B MoE模型

步骤2:撰写摘要Snowflake公司发布了一款名为Arctic的顶级大型语言模型(LLM),专注于企业级应用。Arctic模型具备两个主要优势:高效智能和开源开放。在企业...

OpenAI在亚洲开设第一个办事处,GPT-4速度快3倍

OpenAI在亚洲设立首个办事处,并针对日语优化GPT-4模型,推理速度提升3倍,提高日文理解与文本生成精准度。日本办事处由长崎忠雄负责,旨在加速全球化市场布...

OpenAI在API新增”项目“功能,可精细化管理模型

OpenAI在其API仪表盘中新增了“项目”管理功能,旨在帮助企业和个人开发者更精细化地管理和跟踪模型。这项功能对于需要精细管理模型使用的大型企业和复杂部门的...

XAI有什么用?探索LLM时代利用可解释性的10种策略

研究者们提出了「Usable XAI」的概念,探讨了在大模型时代提高XAI实际应用价值的10种策略。这些策略旨在通过XAI优化LLM与AI系统,并利用LLM增强XAI框架。研究...

“弱智贴吧”的数据,居然是最强中文语料库

AIGC领域专业社区关注:本篇文章来自一个专注于AIGC领域的专业社区,关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地。COIG-CQ...

OpenAI发布全新微调API :ChatGPT支持更详细可视化微调啦!

OpenAI在其官网宣布新增6个微调API功能,旨在帮助企业和开发人员构建特定领域的ChatGPT应用。这些功能包括基于Epoch的检查点创建、Playground新功能、第三方...

融合RL与LLM思想,探寻世界模型以迈向AGI/ASI的第一性原理反思和探索「RL×LLM×WM>AI4S>AGI>ASI」

「上篇」AlphaDev的尝试AlphaDev是DeepMind基于AlphaZero打造的AI,通过单人“组装”游戏进行训练,拥有学习算法和表示函数两个核心组件。它在基础排序算法和哈...
12