全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了

互联网资讯9个月前发布 tree
98 0 0

今日应用


今日话题


全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了 月之暗面
全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了
 

重点标签 文生图IdeogramAI融资多模态

文章摘要


新智元报道编辑:润 好困

新智元导读】 Ideogram凭借其卓越的生图能力和领先的图片中文字渲染能力,获得了包括Jeff Dean和Karpathy在内的投资者的8000万美元融资文生图这一AI赛道迎来了一位重量级选手。

文生图领域已经成为AI创业公司的黄金起点,尽管谷歌、微软等大厂已在此领域投入大量资源。Ideogram以其出色的文字渲染能力脱颖而出,成功融资8000万美元。用户只需在prompt中输入文字,即可在生成的图片中自然且可控地展示。Ideogram还能根据用户需求生成悬浮文字或立体文字,甚至仅凭一句提示词就能创作出与图片高度配合的梗图。

Ideogram在图片中的文字生成方面表现出色,解决了其他生图AI难以处理的问题。其文字渲染能力在数据对比上优于DALL·E 3,生成的图片自然且逼真。用户可以精准地将文字内容与各种风格的图片结合,甚至无需后期加工。Ideogram 1.0还提供了「Magic Prompt」功能,降低用户生成创意图片的门槛。

除了文字渲染,Ideogram在其他生图方面也表现出色。它能理解复杂提示词,生成清晰、细致的图像,如逼真的照片级图片和超自然风格的图片。Ideogram 1.0的免费用户每天可使用25个提示词,生成100张图。订阅价格亲民,8美元/月用户可生成更多图片。

在与Midjourney V6的实测对比中,Ideogram在多个方面表现出色,尤其是在文字渲染方面。尽管Midjourney在某些测试中略胜一筹,但Ideogram在梗图和表情包生成方面表现出强大的文字能力,几乎接近多模态「图+文」模型。

文章来源


原文地址: 点我阅读全文
原文作者: 新智元

© 版权声明

相关文章

暂无评论

暂无评论...