标签:Hessian分析

CLIP-Mamba:首次提出用CLIP训练Mamba,仅用1/5参数就达到ViT天花板性能

摘要:本文介绍了利用对比语言-图像预训练(CLIP)训练的Mamba模型,并在26个零样本分类数据集和16个分布外(OOD)数据集上进行了评估。研究发现,6700万参数...