标签:图像分类

英伟达也对 Mamba下手了 ,视觉 Transformer 与 Mamba 的完美融合 !

MambaVision的核心贡献在于其创新的架构设计,它结合了Mamba和Transformer的优势,通过在最后几层加入自注意力块,有效提升了捕获长距离空间依赖关系的建模能...

悉尼大学&商汤提出LocalMamba:使用局部扫描机制打造更适配视觉任务的Mamba模型

引言LocalMamba是一种新的视觉状态空间模型,它在图像局部依赖关系捕捉方面具有显著优势,同时保持全局上下文理解。该模型通过窗口化选择性扫描和扫描方向搜...