今日应用
今日话题
OpenAI秘密武器「草莓」计划曝光!Q*推理能力大爆发,逼近AGI L2里程碑
重点标签 OpenAI、草莓项目、AI推理、AGI路线图、技术突破
文章摘要
摘要:
OpenAI的新项目「草莓」(Strawberry)已经引起了广泛关注,它是一个能够提前计划、自主浏览网页并进行深度研究的AI系统。据内部文件披露,OpenAI团队正在积极推进这个项目,尽管具体运作方式在公司内部也是高度保密的。从AGI(人工通用智能)五级路线图来看,Strawberry可能已经达到了Level 2级别,显示出接近人类水平的推理能力。
Strawberry模型旨在提升AI的推理能力,使其能够不仅生成查询答案,还能进行自主且可靠的互联网浏览和深度研究。目前,尚未有其他AI模型实现这一目标。OpenAI希望Strawberry的创新能够显著提高AI模型的推理能力,这涉及到在经过大量数据集预训练后的AI模型进行特殊处理。
路透社采访的研究人员强调,推理能力是AI达到人类或超人类智能的关键。尽管现有的大型语言模型(LLM)能够快速总结文本和撰写文章,但在解决直观的常识性问题时表现不佳。因此,改进AI模型的推理能力是解锁其潜力的关键,这将有助于AI在科学发现和软件应用开发等领域取得重大进展。
Strawberry项目包括一种「后训练」方法,即在AI模型经过大量通用数据训练后,调整基础模型以优化性能。这种方法与斯坦福大学开发的「自我教导推理者」(STaR)类似,后者通过迭代创建训练数据来自我提升智能水平。
此外,OpenAI希望Strawberry能够执行长时间任务(LHT),这需要模型提前计划并执行一系列动作。为了实现这一目标,OpenAI正在创建和评估「深度研究」数据集的模型,并计划测试其在软件和机器学习工程师工作中的应用能力。
在2024年7月的OpenAI全员会议上,公司展示了一个神秘研究项目,其推理能力达到了类人水平,这可能与Strawberry有关。同时,OpenAI的AGI路线图显示,公司正朝着实现AGI的五大等级迈进,目前处于第一级别,即聊天机器人,但很快将达到第二级别,即推理者。
2023年11月,OpenAI的Q*项目曾引爆AI社区,其能力是解决以前从未见过的数学题,这被视为朝AGI迈出的重要一步。Q*可能基于AlphaGo式蒙特卡罗树搜索token轨迹,结合了Q值和A*算法的核心主题。
最近,OpenAI在旧金山人工智能工程师世界博览会上展示了GPT-4o Voice、ChatGPT桌面版、Sora和Voice Engine等产品,展示了AI在语音、图像识别和视频生成等方面的先进能力。如果结合Strawberry的推理能力,OpenAI离实现AGI可能已经非常接近。
文章来源
原文地址: 点我阅读全文
原文作者: AIGC新智界