标签:GPT-2

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

Karpathy 表示,他选择从 GPT-2 开始,因为它是大语言模型的鼻祖,并且有可用的模型权重。项目的原始训练实现在 GitHub 上提供。项目在开始时一次性分配所有...