斯坦福抄袭清华、面壁智能大模型,当事人已道歉、删项目

AI最新资讯1个月前发布 tree
18 0 0

今日应用


今日话题


斯坦福抄袭清华、面壁智能大模型,当事人已道歉、删项目
斯坦福抄袭清华、面壁智能大模型,当事人已道歉、删项目
 

重点标签 抄袭事件斯坦福大学AI模型开源项目清华大学

文章摘要


斯坦福大学两名学生Aksh Garg和Siddharth Sharma承认抄袭了清华大学和面壁智能联合开发的多模态大模型MiniCPM-Llama3-V2.5,并在社交平台公开道歉。斯坦福大学AI实验室主任Christopher Manning也证实了这一抄袭事件,并表扬了国内大学、企业对开源大模型的贡献。

整个抄袭事件的全过程如下:
1. 5月29日,斯坦福大学AI团队宣称开源了一款名为Llama3-V的多模态模型,声称只需500美元就能训练出超过GPT-4V、GeminiUltra、ClaudeOpus等众多知名模型。
2. 6月2日,有开发者质疑Llama3-V抄袭了清华和面壁智能联合开源的最新项目V2.5。主要抄袭证据包括:
– 特色功能一样:V2.5能识别中国战国时期写在竹子上的罕见古文字”清华简”,Llama3-V也能识别,但训练数据并非公开。
– Llama3-V的模型架构、代码、配置文件、分词器基本一样,只是增加了高斯噪声、变量名称不一样。
– 重叠度高达87%,且有非常相似的误差分布。
– 犯的错误一样,Llama3-V用于测试WebAgent时与V2.5犯的错误一样,而V2.5使用的是内部未公开的训练数据。
3. 斯坦福AI实验室主任Christopher Manning证实抄袭事件,并表示犯了错误就要勇于承认,同时表扬了清华大学的贡献。
4. 两位学生在社交平台公开道歉,但态度并不诚恳,使用了同样的道歉信,且试图甩锅给另一位名叫Mustafa Aljadery的人。

这个抄袭事件折射出我国在AI芯片制裁背景下对大模型开发、训练的无奈,同时也反映出我们的大模型开源生态被低估,通义千问、面壁智能、百川智能等优秀开源项目已获得世界认可并迅速崛起。

文章来源


原文地址: 点我阅读全文
原文作者: AIGC开放社区

© 版权声明

相关文章

暂无评论

暂无评论...