今日应用
今日话题
重点标签 AIGC、GPT-4、Vision、OCR、开发者
文章摘要
OpenAI宣布全面开放GPT-4 Turbo API中的Vision功能,该功能类似于OCR,但可以与大模型结合使用,提供更广泛的应用场景。
Vision功能支持图像分类、检测和数据转换等操作。
自2023年11月6日发布GPT-4 Turbo模型以来,许多企业和个人开发者已经利用Vision开发了实际业务用例。
例如,AI代理Devin的视觉识别功能和Snap应用的美食识别功能。
Vision相当于大模型的“眼睛”,将图像、标签和符号等转化为特定数据,扩大了开发应用的边界。
GPT-4-turbo的训练数据已更新至2023年12月,上下文支持最多12.8万tokens。
文章来源
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...