媲美Sora,最长2分钟!快手发布文生视频大模型-可灵

AI最新资讯4个月前发布 tree
54 0 0

今日应用


今日话题


媲美Sora,最长2分钟!快手发布文生视频大模型-可灵
媲美Sora,最长2分钟!快手发布文生视频大模型-可灵
 

重点标签 AIGC大语言模型快手AI视频生成技术特性

文章摘要


快手AI团队发布了一款名为“可灵”的文生视频大模型,专注于AIGC领域的发展和应用落地。可灵模型能够通过文本生成2分钟、1080P、每秒30帧的超长视频,其在色彩、视频质量、动作一致性、文本语义理解等方面的表现可与OpenAI的Sora相媲美,并具备模拟物理世界的独特技术特性

可灵模型采用了Diffusion Transformer架构和3D时空联合注意力机制,能够精准捕捉视频帧内的局部空间特征以及跨帧的时间动态特征,全面理解和再现视频中的运动信息。这使得无论是快速移动的物体、剧烈变化的场景还是复杂的人物动作,都能被精确捕捉,生成的视频内容具有很高的动态性和物理世界真实感。

特别值得一提的是,可灵模型已经开放测试,用户可以直接在其官网下载应用进行体验。此外,可灵还采用了可变分辨率的训练策略,在模型训练阶段引入不同分辨率的数据输入,使模型能够学习到丰富的特征表示,轻松适配手机、平板、PC等不同设备,满足电影制作、游戏开发、社交营销、在线教育等不同业务场景的需求。

通过展示由可灵生成的视频案例,可以看出其在动作协调性、一致性、色彩、运动率等方面的表现相当出色。有兴趣的用户可以直接下载使用,体验可灵大模型带来的创新视频生成技术。

本文素材来源于可灵大模型官网,如有侵权请联系删除。

文章来源


原文地址: 点我阅读全文
原文作者: AIGC开放社区

© 版权声明

相关文章

暂无评论

暂无评论...