这或许会是你和AI一起过的第一个万圣节。作者 | 甘德 编辑 | 郑玄近日,OpenAI 和 Sora 项目的动荡让外界对热闹的 AI 视频行业捏了一把汗。9 月末,OpenAI 首席技术官米拉·穆拉蒂(Mira Murati),以及在 o1 模型、GPT-4o、GPT-4v 模型的开发过程中扮演了重要角色的研究副总裁巴雷特·佐夫(Barret Zoph)与首席研究官鲍勃·麦克格卢(Bob McGrew)也宣布离职。10 月 4 日,Sora 项目负责人蒂姆・布鲁克斯(Tim Brooks)在社交平台 X 上官宣离职,加入谷歌 DeepMind。如果搭配 Sora 正式版一直没有确切时间表的现实一起食用,这像极了某个明星项目泡沫被戳破,局中人各自打算的熟悉戏码。而最近 AI 视频的竞赛,也开始呈现出一些白热化。据 SimilarWeb 统计,位居全球前列的 AI 视频生成企业 Luma AI 网站在 9 月的总访问量仅为 1181 万次,环比下跌 38.49%。红极一时的 Pika 也在 9 月总访问量出现跌落。虽然其在 10 月新版本中凭借一批新的模版效果再次爆火,但产品如何持续的吸引用户兴趣的问题也逐渐浮出水面。一些最初对 Sora 持谨慎态度的声音现在再度被拿出来重新咀嚼,比如电影制作人帕特里克·塞德伯格(Patrick Cederberg)在 4 月所说,他必须让模型生成数百个短片,才能找到一个可用的短片。换句话说,Sora 的使用非常困难。所幸的是,Tim Brooks 并没有告别 AI 视频,他大概率加入了 DeepMind 的 AI 视频生成工具 Veo。Sora 的起落或许不是 AI 视频行业的唯一标尺,至少在能力上,开始有 Meta Movie Gen 这样的挑战者开始宣称干掉了 Sora。而国内的 AI 视频产品生态,也一直在有新的变化。AI 视频赛道的降温,换句话说,也是下一批更好产品迭代出来之前的酝酿期。而最近似乎有了一个足够惊艳的产品走入大众视野。这个视频的「始作俑者」,是爱诗科技几天前发布的 PixVerse V3。随着 PixVerse V3 的发布,不仅在模型方面再次惊艳行业,而且在 toC 落地方面也开始「破圈」。
01
PixVerse V3 真把次元壁打破了
在市面上的 AI 视频产品已经充实到让人开始「视觉疲劳」情况下,PixVerse V3 真的足够特别?如果你抱着类似的疑惑,那这只皮卡丘的出现就足够打消大半。除了那些无法被复现的发布会演示作品,这大概是 AI 视频生成中二次元形象和真实世界第一次能够如此和谐的进行互动。画面里,这只皮卡丘的形象与我们印象中卡通片中的样子别无二致,但它却出现在一条真实的繁忙街道上,然后就这么水灵灵的跳到了一个小哥怀里。这是这段视频所需要的 Prompt:
1934 年,米高梅出品的《Hollywood Party》里吉米·杜兰特用手指」叼着「米老鼠的动作,成为世界影史中卡通与真实影像结合的第一个经典画面。90 年后,这个充满巧思但在实现上却异常繁琐的效果终于可以用 AI 来代为效劳。离谱的是,皮卡丘是 AI 做的,皮卡丘所在的真实世界也是 AI 做的。从效果看,PixVerse V3 对于动画进入现实世界这件事,理解的相当丝滑。不止是皮卡丘,你还可以用用下面这段看起来要素过多的 Prompt,来生成一个马里奥大叔进火车站的视频:
The video shows a bustling train station filled with a diverse crowd of passengers eagerly waiting for their trains. The camera sweeps across the scene, capturing the lively atmosphere. Super Mario, a stout Italian character with a round face, dons his iconic red hat and blue overalls. The camera closely follows Mario as he steps confidently onto the platform, his face beaming with excitement.. The video is in a realistic style.视频中,火车站熙熙攘攘,各色乘客焦急地等待火车。镜头扫过整个场景,捕捉到热闹的气氛。当火车缓缓驶近站台时,镜头紧跟身材魁梧、脸庞圆润的意大利人物超级马里奥,他戴着他标志性的红帽子和蓝色工作服,自信地走上站台,脸上洋溢着兴奋的笑容。视频的风格很写实。