Hello,贾维斯!Hello,GPT-4o!

今日应用


今日话题


Hello,贾维斯!Hello,GPT-4o!
Hello,贾维斯!Hello,GPT-4o!
 

重点标签 GPT-4o模型实时推理多模态交互安全性OpenAI

文章摘要


摘要:
OpenAI发布了其新旗舰模型GPT-4o,这是一个能够实时处理音频、视觉和文本输入并生成相应输出的全能模型。GPT-4o在人机交互方面迈出了重要一步,其响应时间与人类对话相似,同时在非英语文本处理上取得了显著进步。与之前的模型相比,GPT-4o在视觉和音频理解上表现更为出色。

GPT-4o通过单一神经网络处理所有输入和输出,使得信息传递更为高效。在传统基准测试中,GPT-4o展现了与GPT-4 Turbo相当的性能,并在多语言、音频和视觉能力上创下了新记录。

安全性方面,GPT-4o设计了多种措施,包括筛选训练数据和调整模型行为,以及创建新的安全系统以确保语音输出的安全性OpenAI还对GPT-4o进行了广泛的外部红队测试,以确定新模态可能引入的风险,并据此建立安全干预措施。

目前,GPT-4o的文本和图像功能已在ChatGPT中推出,并向Plus用户提供了更多消息限制。开发人员也可以通过API访问GPT-4o,其速度是GPT-4 Turbo的两倍,价格减半,速率限制提高五倍。OpenAI计划在未来向API中的一部分信任伙伴提供GPT-4o的新音频和视频功能支持。

文章来源


原文地址: 点我阅读全文
原文作者: AIGC最前线

© 版权声明

相关文章

暂无评论

暂无评论...