今日应用
今日话题
文章摘要
智谱AI发布了一款名为「清影」的视频生成大模型,它能够根据用户创意生成高精度视频。用户只需提供几个字到几百个字的创意和30秒的等待时间,即可获得1440×960清晰度的视频。清影已上线清言App,用户可以在网页端、App或AI动态照片小程序中体验其功能。目前,清影生成的视频时长为6秒,所有用户均可免费使用。
智谱AI表示,随着技术的进步,清影的生成能力将扩展至短视频制作、广告生成和电影剪辑等领域。在研发过程中,Scaling Law在算法和数据方面发挥了重要作用。智谱AI CEO张鹏强调,随着算法和数据的迭代,Scaling Law将继续发挥其影响力。
清影在风景、动物、科幻、人文历史等类型的视频内容上表现良好,擅长生成卡通风格、真实摄影风格和二次元动漫风格等视频。在实体类型呈现效果上,动物的表现优于植物、物品、建筑和人物。清影支持文生视频和图生视频,能够生成奇幻动画风格的内容。
用户可以通过提供提示词或上传图片来生成视频。例如,用户可以描述一个场景或动作,清影会根据这些信息生成相应的视频。此外,清影还可以将静态图片转化为动态视频,为用户带来新的创作玩法。
智谱AI的清影基于自研的新一代视频生成大模型CogVideoX,该模型融合了文本、时间和空间三个维度。CogVideoX采用了Sora算法设计,通过优化,推理速度比前代模型提升了6倍。智谱AI还自研了高效的三维变分自编码器结构(3D VAE),大幅降低了模型训练成本和难度。
为了解决视频数据缺乏描述性文本的问题,智谱AI自研了端到端的视频理解模型,为视频数据生成详细且贴合内容的描述。此外,智谱AI还研发了一种将文本、时间和空间融合的transformer架构,通过expert adaptive layernorm对文本和视频特征空间进行处理,提高了模型的指令遵循度。
随着清影的上线,视频生成领域迎来了智谱AI这一重量级玩家。清影API也已上线大模型开放平台bigmodel.cn,企业和开发者可以通过API调用体验和使用文生视频和图生视频的模型能力。如今,无论是没有视频制作基础的人还是专业内容创作者,都能借助大模型实现视频创作。同时,「真格星球AI+创业营」为创业者提供了与大咖导师和同道创业者交流的平台,助力AI灵感碰撞和商机寻找。
文章来源
原文地址: 点我阅读全文
原文作者: 机器之心