标签:扩散模型

无限生成视频,还能规划决策,扩散强制整合下一token预测与全序列扩散

MIT CSAIL的研究团队在陈博远博士的带领下,提出了一种名为Diffusion Forcing(DF)的训练和采样范式,将全序列扩散模型与自回归大型语言模型的优势结合起来...

何恺明新工作!加入MIT的首篇论文!打破自回归图像生成瓶颈,奥赛金牌得主参与!

摘要:近日,深度学习领域的杰出研究者何恺明及其团队推出了一项突破性研究,成功地将自回归模型从矢量量化的束缚中解放出来,实现了连续值生成图像的创新。...

DiG:使用门控线性注意力机制的高效可扩展 Diffusion Transformer

本文介绍了一种新型的扩散模型——DiG(Diffusion Gated Linear Attention Transformers),由华中科技大学和字节跳动的研究团队共同开发。DiG模型通过引入门控...

一文回顾2024年2D/3D生成方向工作进展

摘要总结:2023年末至2024年间,3D生成领域经历了显著的技术进步。在这一时期,DreamFusion等项目的成功推动了基于2D扩散模型的3D生成技术发展。这些技术通过...

基于扩散模型的,开源世界模型DIAMOND

日内瓦大学、微软研究院和爱丁堡大学的研究人员联合开发了基于扩散模型的世界模型—DIAMOND。该模型旨在通过捕捉视觉细节和建模复杂多模态分布,提高智能体训...

世界模型也扩散!训练出的智能体竟然不错

日内瓦大学、爱丁堡大学和微软研究院的研究者联合提出了一种名为DIAMOND的强化学习智能体,该智能体在扩散世界模型中接受训练。DIAMOND在Atari 100k基准测试...

为Stable Diffusion模型瘦身并达到SOTA!LAPTOP-Diff:剪枝蒸馏新高度(OPPO)

步骤2:撰写详细、分段的摘要总结本文介绍了一种用于压缩扩散模型的层剪枝和归一化蒸馏方法(LAPTOP-Diff),旨在提高Stable Diffusion模型(SDM)的高效架构...

CVPR’24|LiDAR Diffusion:当扩散模型从图像打入LiDAR场景!

摘要:在自动驾驶和机器人技术领域,条件LiDAR场景生成是一个重要的研究方向。最近,作者提出了一种名为LiDAR扩散模型(LiDAR Diffusion Models)的新型生成...

加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了

摘要:字节跳动技术团队提出了一种名为Hyper-SD的新型扩散模型蒸馏框架,该框架结合了轨迹保持蒸馏和轨迹重构蒸馏两种策略的优点,旨在压缩去噪步数的同时保...

Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型

步骤2:撰写摘要Lilian Weng在其博客中探讨了视频生成的扩散模型,这是图像合成领域的一个更复杂的任务。视频生成需要在不同帧之间保持时间一致性,并且收集...
12