标签:性能测试

2万亿训练数据,120亿参数!开源大模型Stable LM 2-12B

Stable LM 2架构采用Transformer,共24层,32个自注意力头,使用大量公开数据集进行预训练。Stability.ai使用了一种称为“FlashAttention-2”的高效序列并行优...

3140亿参数,可商用!马斯克开源大模型Grok-1

Grok-1开源与性能介绍:专注AIGC领域的专业社区,本文介绍了马斯克旗下公司x.ai开源的大模型Grok-1。Grok-1是一款类ChatGPT的混合专家模型,具有3140亿参数,...