今日应用
今日话题
CVPR 2024|NAT其实真的不输扩散模型!AutoNAT:全新定制训练&生成策略拓宽性能边界
重点标签 AutoNAT、图像生成、非自回归、NAT、优化策略
文章摘要
极市导读:本文提出了一种名为AutoNAT的新方法,旨在通过统一优化问题来自动设计训练和生成策略,以提高非自回归Transformer(NAT)在图像生成任务中的性能。
1. AutoNAT:重新思考图像生成中的非自回归建模
– 诞生背景:扩散模型在图像生成领域虽然成功,但计算成本高,需要更高效的替代方案。NAT作为一种高效方案,与扩散模型相比性能较差,主要原因在于训练和生成策略的设计。
– NAT方法简介:NAT通常与预训练的VQ-autoencoder结合使用,负责图像与latent视觉tokens之间的转换。训练策略基于掩码token建模目标函数,生成策略则涉及多步生成过程。
– AutoNAT方法:提出一种联合优化框架,通过交替优化生成策略和训练策略来提高NAT的性能。生成策略优化通过梯度下降解决,训练策略优化则采用Beta分布简化问题并使用Greedy Search。
– 实验结果:在ImageNet-256、ImageNet-512、MS-COCO和CC3M数据集上验证了AutoNAT的有效性。与现有方法相比,AutoNAT在生成质量和计算成本方面均表现出色。
总结:AutoNAT通过自动优化训练和生成策略,显著提高了NAT在图像生成任务中的性能,有望成为扩散模型的高效替代方案。
文章来源
原文地址: 点我阅读全文
原文作者: 极市平台
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...