标签:模型训练

小模型站起来了,浏览器里跑出SOTA,抱抱脸:快逃,合成数据不是未来

摘要:抱抱脸公司(Hugging Face)开发了一种新的SOTA小模型,这些模型在不同的数据规模级别上取得了显著的胜利。该公司的首席科学家Thomas Wolf分享了开发这...

半监督目标检测相关方法总结

本文详细介绍了半监督目标检测算法,这是一种利用大量未标记数据来提升模型检测性能的方法。文章首先对目标检测的不同设置进行了分类,包括有监督、弱监督、...

万亿token!史上最大多模态数据集诞生

华盛顿大学、Salesforce Research和斯坦福大学等机构的联合团队发布了一个名为MINT-1T的万亿token级开源多模态数据集,旨在推动多模态大模型(LMM)的发展。...

菲尔兹奖得主亲测GPT-4o,经典过河难题破解失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM

在探讨大型语言模型(LLM)的数学推理能力时,菲尔兹奖得主Timothy Gowers对GPT-4o进行了一项测试,以解决经典的“狼-山羊-卷心菜”过河问题。结果显示,即使是...

顶刊TPAMI 2024!黄高团队提出EfficientTrain++:高效视觉骨干训练方法

摘要:本文介绍了清华大学自动化系2019级直博生王语霖及其团队在IEEE Transactions on Pattern Analysis and Machine Intelligence(TPAMI)上发表的论文《Ef...

有手就能训——给AI“老人”写的transformer序列建模指南

摘要:文章讨论了在AI新时代中,如何适应新颖算法和高实验条件的挑战。作者提出更新思维,成为“调包侠”,利用Hugging Face的Transformers等现代包来简化入门...