谷歌重磅发布Gemini 1.5 Pro:能自动写影评,理解视频!

AI最新资讯2个月前发布 tree
28 0 0

今日应用


今日话题


谷歌重磅发布Gemini 1.5 Pro:能自动写影评,理解视频!
谷歌重磅发布Gemini 1.5 Pro:能自动写影评,理解视频!
 

重点标签 AIGCGemini 1.5 Pro多模态理解视频音频解析谷歌API

文章摘要


Gemini 1.5 Pro发布:谷歌在官网发布了AIGC领域的专业社区的新工具——Gemini 1.5 Pro,该工具现在可以在180多个国家/地区使用。它不仅能生成创意文本和代码,还能根据用户输入的文本提示,理解、总结上传的视频、音频内容进行深度总结。

多模态理解能力:Gemini 1.5 Pro的多模态理解能力非常强大,可以对视频和音频进行解析。在视频理解方面,虽然模型对上传视频的解析速度较慢,但通过使用谷歌内置的视频示例,可以快速展示其能力。在音频理解方面,Gemini 1.5 Pro的解析速度非常快,能够精准解读音频内容。

Gemini API的改进:谷歌对Gemini API进行了性能优化,包括系统指令、JSON模式以及函数调用优化。系统指令功能可以帮助开发者根据特定需求和用例控制模型的行为。JSON模式允许开发者从文本或图像中提取结构化数据。函数调用优化则支持开发者实现更全面的查询响应。

开发者试用:目前,Gemini 1.5 Pro可以在Google AI Studio开发平台中免费试用,支持中文进行提示。这对于AIGC开发者生态来说是一个巨大的福音,可以帮助开发者更好地控制Gemini模型,提升模型的稳定性和输出能力。

总结:Gemini 1.5 Pro的发布为AIGC领域带来了新的机遇,其多模态理解能力和API的改进将极大地推动大语言模型(LLM)的发展和应用落地。开发者可以利用这一工具提升工作效率,节省时间,创造出更多有价值的内容。

文章来源


原文地址: 点我阅读全文
原文作者: AIGC开放社区

© 版权声明

相关文章

暂无评论

暂无评论...