今日应用
今日话题
媲美Sora,最长2分钟!快手发布文生视频大模型-可灵
重点标签 AIGC、大语言模型、快手AI、视频生成、技术特性
文章摘要
快手AI团队发布了一款名为“可灵”的文生视频大模型,专注于AIGC领域的发展和应用落地。可灵模型能够通过文本生成2分钟、1080P、每秒30帧的超长视频,其在色彩、视频质量、动作一致性、文本语义理解等方面的表现可与OpenAI的Sora相媲美,并具备模拟物理世界的独特技术特性。
可灵模型采用了Diffusion Transformer架构和3D时空联合注意力机制,能够精准捕捉视频帧内的局部空间特征以及跨帧的时间动态特征,全面理解和再现视频中的运动信息。这使得无论是快速移动的物体、剧烈变化的场景还是复杂的人物动作,都能被精确捕捉,生成的视频内容具有很高的动态性和物理世界真实感。
特别值得一提的是,可灵模型已经开放测试,用户可以直接在其官网下载应用进行体验。此外,可灵还采用了可变分辨率的训练策略,在模型训练阶段引入不同分辨率的数据输入,使模型能够学习到丰富的特征表示,轻松适配手机、平板、PC等不同设备,满足电影制作、游戏开发、社交营销、在线教育等不同业务场景的需求。
通过展示由可灵生成的视频案例,可以看出其在动作协调性、一致性、色彩、运动率等方面的表现相当出色。有兴趣的用户可以直接下载使用,体验可灵大模型带来的创新视频生成技术。
本文素材来源于可灵大模型官网,如有侵权请联系删除。
文章来源
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...