标签:视频生成

攻陷短视频后,Sora将需要72万块H100 GPU

文章主要讨论了 OpenAI 推出的 Sora 模型,这是一个建立在扩散 Transformers(DiT)之上的扩散模型,用于生成逼真的视频内容。Sora 证明了扩大视频模型的有效...

全日程发布|Sora之后的视频生成技术与应用

论坛将邀请行业内知名专家和一线技术负责人进行演讲,如张俊林、朱思语、曾妍、陈石、杨欢、高一钊、王耀晖、卞正达和童同。他们将分享视频生成领域的技术突...

文本直接生成2分钟视频,即将开源模型StreamingT2V

AIGC领域的新突破: 研究人员来自Picsart人工智能研究所、德克萨斯大学和SHI实验室联合推出了StreamingT2V视频模型,该模型能够通过文本直接生成不同时间长度...

详解Latte:去年底上线的全球首个开源文生视频DiT

摘要:Latte模型是一个开源的文生视频DiT模型,由上海人工智能实验室的研究团队联合其他机构开发。该模型旨在解决将DiT模型扩展到视频生成领域的挑战。文章详...

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

摘要:Mora 是一个由理海大学和微软研究院提出的多智能体框架,旨在复制 OpenAI 的 Sora 视频生成模型的能力。Mora 通过整合多个视觉 AI 智能体,成功模仿了 ...

技术神秘化的去魅:Sora关键技术逆向工程图解(文末留言赠书活动)

摘要:本文由作者张俊林撰写,主要分析了Sora视频生成模型的可能做法,探讨了其整体结构和关键组件。文章强调了技术开放的重要性,并尝试对Sora进行逆向工程...

没等来OpenAI,等来了Open-Sora全面开源

Open-Sora 1.0是由Colossal-AI团队全面开源的全球首个类Sora架构视频生成模型。该模型包括整个训练流程、数据处理、所有训练细节和模型权重,旨在与全球AI爱...

从直观物理学谈到认知科学,Sora不是传统物理模拟器盖棺定论了?

Sora是OpenAI推出的一个视频生成模型,它能够根据文本提示生成高质量的视频。尽管Sora在技术上取得了巨大进步,但它是否能够被称为“世界模拟器”仍存在争议。...

被误解的「中文版Sora」背后,字节跳动有哪些技术?

文章总结了字节跳动在视频生成领域的最新研究成果,特别是在生成式AI技术方面。文章首先介绍了OpenAI发布的Sora,一个在视频生成领域树立新标准的模型。随后...

文本+图片生成高保真视频,阿里推出视频模型AtomoVideo

AtomoVideo 是由阿里巴巴集团技术团队推出的一款文本+图片生成高保真视频模型。用户仅需提供高清图片和文本提示,即可快速生成逼真细节的高清视频。该模型在...