又一「国产版Sora」全球上线!清华朱军创业团队,视频生成仅需30秒

AI最新资讯2个月前发布 tree
22 0 0

今日应用


今日话题


又一「国产版Sora」全球上线!清华朱军创业团队,视频生成仅需30秒
又一「国产版Sora」全球上线!清华朱军创业团队,视频生成仅需30秒
 

重点标签 Vidu视频生成器AI视频工具多模态通用大模型动漫风格角色一致性

文章摘要


Vidu视频生成器AI视频工具的突破与创新

Vidu视频生成器是由生数科技推出的一款AI视频工具,它在视频生成领域实现了重大突破。三个月前,Vidu的宣传视频以其逼真效果引起了广泛关注。如今,Vidu正式上线,用户无需申请即可体验。Vidu不仅具备高动态性、高逼真度和高一致性等优势,还新增了动漫风格、文字与特效画面生成、角色一致性等特色功能。

文生视频与图生视频:两大核心功能

Vidu的两大核心功能是文生视频和图生视频,提供4秒和8秒两种时长选择,分辨率最高可达1080P。文生视频可以根据文本提示生成视频,而图生视频则可以根据上传的图片生成视频。Vidu在动作幅度、画面自然度和真实物理世界模拟方面表现出色,有效解决了画面崩坏的问题。

动漫风格角色一致性:创新特色

Vidu支持动漫风格的视频生成,用户可以直接输入提示词生成动漫风格视频,或者上传动漫参考图片,使图片中的动漫人物动起来。此外,Vidu的角色一致性功能允许用户上传角色图像,指定角色在任意场景中做出任意动作,为创作梗图和表情包提供了便利。

快速生成:业界领先的推理速度

Vidu的生成效率非常高,仅需30秒就能生成一段4秒镜头,速度是业内最快水平的两倍。这得益于Vidu基于完全自研的U-ViT架构,该架构是全球首个融合Diffusion和Transformer的架构,使得文本到视频的转换更加直接和连续。

生数科技:多模态通用大模型的领导者

生数科技成立于2023年3月,核心成员来自清华大学人工智能研究院。公司致力于自主研发世界领先的可控多模态通用大模型,已获得多家知名产业机构的认可和数亿元融资。Vidu的发布展示了生数科技在视频生成能力上的领先,以及在商业化方面的精心布局。

商业化布局:模型层与应用层并行发展

生数科技采取模型层和应用层两条路走路的模式。一方面,构建覆盖文本、图像、视频、3D模型等多模态能力的底层通用大模型,面向B端提供模型服务能力。另一方面,面向图像生成、视频生成等场景打造垂类应用,按照订阅等形式收费,主要应用于游戏制作、影视后期等内容创作场景。

文章来源


原文地址: 点我阅读全文
原文作者: 机器之心

© 版权声明

相关文章

暂无评论

暂无评论...