今日应用
今日话题
Meta的Llama-3.1-405B遭泄漏,可下载,性能超GPT-4o!
重点标签 AIGC社区、Meta、Llama模型、数据泄露、AI算力
文章摘要
Meta的Llama 3.1-405B评测数据遭遇泄漏,社区发现其70B版本性能超GPT-4o。尽管磁力链接泄露,但模型对GPU要求高,个人开发者难以负担。网友认为,与GPT-4o mini相比,Llama 3.1-70B性价比低。模型可能面向企业、政务部门。泄漏事件可能与微软Azure有关,但Meta推迟发布405B系列。若数据真实,对全球是福利,但开发AI应用需强大算力、数据和微调技术。社区怀疑Meta故意泄露,以测试市场反应。
AIGC社区关注Meta Llama模型数据泄露事件
AIGC开放社区关注了Meta公司Llama 3.1-405B模型的评测数据泄露事件。据爆料,除了405B版本外,还将发布一个70B版本的模型。尽管70B版本在性能上超过了GPT-4o,但其对GPU的高要求使得个人开发者难以承担部署成本。
磁力链接泄露,下载速度尚可
社区发现,泄露的磁力链接提供了模型的下载,大小约为763.84G,下载速度可达每秒14M。尽管huggingface上的库被删除,但已有不少人开始下载该模型。
性价比低,网友泼冷水
网友们对Meta的新模型并不看好。与OpenAI的GPT-4o mini版本相比,Llama 3.1-70B的推理成本提升了3倍,但编码性能却较差。从性价比和功能上看,新模型并没有太多值得期待的地方。
模型可能面向企业、政务部门
由于模型对硬件的高要求,一般GPU难以运行。这可能意味着模型主要面向企业用户和政务公共部门,而非个人开发者。
泄漏事件或与微软Azure有关
有人猜测,泄漏事件可能与微软的Azure Github有关。尽管模型是免费的,但运行起来需要企业级的算力基础。
Meta推迟发布405B系列,社区怀疑故意泄露
由于监管机构和法案的原因,Meta一直在推迟405B系列模型的发布。社区怀疑本次泄漏是Meta故意为之,以测试市场反应。
开发AI应用需强大算力、数据和微调技术
如果评测数据真实,对于全球多数国家来说是一个福利,因为Llama 3系列的顶级模型将全部开放权重。然而,开发生成式AI应用仍需强大的AI算力基础、高质量数据以及微调技术。
社区期待Meta的下一步行动
AIGC开放社区期待Meta在此次事件后的下一步行动,看看公司将如何应对这一挑战。本文素材来源网络,如有侵权请联系删除。
文章来源
原文地址: 点我阅读全文
原文作者: AIGC开放社区