标签:机器之心

替代MLP的KAN,被开源项目扩展到卷积了

机器之心编辑部报道了一种新型的神经网络架构——KAN(Kolmogorov-Arnold Networks),由来自 MIT 等机构的研究者提出。KAN 旨在作为一种有潜力的MLP(多层感知...

苹果卷开源大模型,公开代码、权重、数据集、训练全过程,OpenELM亮相

步骤2:撰写摘要苹果公司最近发布了一款名为OpenELM的高效语言模型族,该模型基于开源训练和推理框架。OpenELM包含四种变体,参数量分别为270M、450M、1.1B和...

MLLM真能看懂数学吗?MathVerse来了次摸底测评,放出当天登热榜

摘要:AIxiv专栏是机器之心发布的一个专注于学术和技术内容的栏目,近年来已经报道了2000多篇内容,涵盖了全球各大高校和企业的顶级实验室,有效促进了学术交...

多篇顶会一作却申博失败?斯坦福博士生亲述:AI领域太卷

文章摘要:一位在多个顶级机器学习会议上发表论文的研究者,在申请博士项目时遭遇挫折。在Reddit社区上,许多用户分享了他们的看法,认为尽管申请竞争激烈的...