Llama 3来了！首批开源 8B 和 70B两个版本，未来有望开源400B大模型！

AI最新资讯3个月前发布 tree

46 0 0

今日应用

龋齿一号

龋齿一号GFXCamp – CG营地|高速下载最新CG素材资源

今日话题

Llama 3 来了！首批开源 8B 和 70B两个版本，未来有望开源400B大模型！
Llama 3来了！首批开源 8B 和 70B两个版本，未来有望开源400B大模型！

重点标签 Llama 3 、 Meta 、开源大模型、人工智能、云平台

文章摘要

步骤2：撰写摘要
Meta 公司发布了其最新版本的开源大模型 ——Llama 3，并计划在未来几个月内推出新功能，包括更长的上下文窗口、额外的模型大小和增强的性能。Llama 3 包含参数为 8B 和 70B 的预训练和指令微调语言模型，支持广泛的用例，并在各种行业基准测试中展现出最先进的性能。

Meta 对 Llama 3 的开发重点关注了模型架构、预训练数据、扩大预训练规模和指令微调四个关键要素。Llama 3 采用了相对标准的仅解码器的 Transformer 架构，并使用了词汇量为 128K 的分词器。在预训练数据方面，Meta 收集了超过 15T 个令牌的数据，其中包括超过 30 种语言的高质量非英语数据。

此外，Meta 还开发了新的高质量人工评估集，包含 1800 个提示，涵盖 12 个关键用例。研究人员还开发了扩展定律，以预测模型在关键任务上的性能，并结合了数据并行化、模型并行化和管道并行化来训练最大的 Llama 3 模型。

为了确保模型的安全性，Meta 采用了系统级的方法，包括指令微调模型的内部和外部红队测试，以及 Llama Guard 2 和 Cybersec Eval 2 等安全工具的更新。Meta 还引入了 Code Shield，用于过滤由 LLM 生成的不安全代码。

Meta 计划发布具有超过 400B 参数的最大模型，并在接下来的几个月中发布具有新功能的多个模型。此外，Meta 正在更新《负责任使用指南》（RUG），以提供使用 LLM 进行负责任开发的全面指南。

Llama 3 模型现已在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、Microsoft Azure、NVIDIA NIM 和 Snowflake 等平台上上线，更多平台的支持即将到来。更多信息可在 Llama 3 官方网站上查看。

文章来源

原文地址: 点我阅读全文
原文作者: AIGC最前线

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

Llama 3来了！首批开源 8B 和 70B两个版本，未来有望开源400B大模型！

今日应用

今日话题

文章摘要

文章来源

全球首个「开源GPT-4」出世！Llama 3震撼发布，Meta AI免登录可用

下接万卡集群、上连AI原生应用，操作系统的进化超出你的想象

相关文章

暂无评论

热门网址

热门标签