今日应用
今日话题
失联大神李沐B站复更:领读Llama 3.1论文,还多讲了一点AI八卦;大模型竞技场Llama 3.1排名第三
文章摘要
AI领域知名专家李沐老师在时隔一年多后,于B站发布了新一期的“经典论文精读系列”,深入解读了Llama-3.1技术论文。视频中,李沐老师不仅详细介绍了Llama-3.1的技术细节,还透露了一些有趣的幕后故事。例如,Llama团队在训练最大模型时,最初同时尝试了MoE模型和稠密模型,但最终MoE模型未能成功,只发布了一个简化版本。
Llama-3.1-405B作为开源模型,在大模型竞技场排名中首次进入前三,仅次于GPT-4o和Claude-3.5-Sonnet。这一成绩在人类评估中与另外两个模型不相上下。此外,Llama-3.1-405B在单项排名中也表现优异,如编码、数学、指令遵循和硬提示等方面均位列前三。同时,Llama-3.1-70B也取得了总榜第9的好成绩,整体置信水平有了显著提升。
国外网友对Llama-3.1-405B的新成绩表示祝贺,并期待其下一次迭代将带来更大的惊喜。网友们已经开始尝试将Llama-3.1-405B应用于各种场景,如在树莓派上运行、创建GitHub仓库的聊天机器人等。尽管存在一些技术问题,但大家对尝试使用Llama-3.1-405B的热情不减。
李沐老师的Llama-3.1论文精读视频和相关榜单数据可在以下链接查看:
– 李沐Llama3.1论文精读:[https://www.bilibili.com/video/BV1WM4m1y7Uh/](https://www.bilibili.com/video/BV1WM4m1y7Uh/)
– 榜单完整数据:[https://chat.lmsys.org/?leaderboard](https://chat.lmsys.org/?leaderboard)
此外,极市平台还提供了多模态大模型解读、Tranformer系列、ICCV2023论文解读等技术专栏,以及Neural ODE、Transformer等技术综述,欢迎点击阅读原文进入CV社区,获取更多技术干货。
文章来源
原文地址: 点我阅读全文
原文作者: 极市平台