标签:大语言模型

MLLM真能看懂数学吗?MathVerse来了次摸底测评,放出当天登热榜

摘要:AIxiv专栏是机器之心发布的一个专注于学术和技术内容的栏目,近年来已经报道了2000多篇内容,涵盖了全球各大高校和企业的顶级实验室,有效促进了学术交...

突发!Stable Diffusion 3,可通过API使用啦

Stability.ai宣布其最新的文生图模型Stable Diffusion 3(SD3)和SD3 Turbo现在可以通过API使用。与前两代相比,SD3在图片质量上有所提升,并且能够更好地理...

谁说大象不能起舞! 重编程大语言模型实现跨模态交互的时序预测 | ICLR 2024

摘要:本文介绍了一种名为Time-LLM的框架,该框架通过模型重编程(model reprogramming)技术,使得大语言模型(LLMs)能够在不经修改的情况下进行高精度时序...

性能超ChatGPT-3.5,专用金融分析的多模态大语言模型

研究人员来自不列颠哥伦比亚大学和Invertible AI联合推出了FinTral,一款专注于金融分析的大语言模型。FinTral不仅支持文本提示,还支持图表、图片的多模态专...

8.3K Stars!《多模态大语言模型综述》重大升级

本篇文章是对多模态大语言模型(MLLM)的全面综述,包括其基础构成、拓展延伸和相关研究课题。文章首先回顾了作者去年发表的业内首篇多模态大语言模型领域的...

杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人

近日,斯坦福助理教授杨笛一等人发表论文《Social Skill Training with Large Language Models》,提出利用大语言模型(LLM)进行社交技能训练的框架。社交技...

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

Karpathy 表示,他选择从 GPT-2 开始,因为它是大语言模型的鼻祖,并且有可用的模型权重。项目的原始训练实现在 GitHub 上提供。项目在开始时一次性分配所有...

OpenAI曾转录100万小时视频数据,训练GPT-4

文章首先介绍了AIGC领域的专业社区,关注微软、OpenAI、百度文心一言、讯飞星火等大语言模型的发展和应用落地。接着,文章提到纽约时报发布的一篇关于科技巨...

DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源

方法概览DeepMind 研究者首先使用 GPT-4 生成 LongFact 提示集,包含 2280 个事实寻求提示,覆盖 38 个主题。LongFact 包含 LongFact-Concepts 和 LongFact-O...

谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力

SELF-DISCOVER可以引导大语言模型根据一组给定的原子推理模块,自行选择、调整和组合这些模块,形成一个用于解决特定任务的推理结构。这种结构不仅结合了多个...
12