标签:Diffusion Transformer
ECCV’24|直接生成 4K图像! PixArt-Σ:Weak-to-Strong 训练的 4K 高清文生图模型
PixArt-Σ是PixArt系列的最新力作,由华为诺亚方舟实验室、大连理工大学、香港大学和香港科技大学共同研发。该模型是一种Diffusion Transformer(DiT),能够...
DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩
摘要:背景:AI社区通过Sora模型的发布,看到了基础扩散模型在生成真实图像和视频方面的潜力。然而,现有模型在设计选择上提供有限的指导,缺乏详细的实现说...