标签:机器学习

Sora之后,OpenAI Lilian Weng亲自撰文教你从头设计视频生成扩散模型

步骤2:撰写摘要Lilian Weng在其博客中探讨了视频生成的扩散模型,这是图像合成领域的一个更复杂的任务。视频生成需要在不同帧之间保持时间一致性,并且收集...

好奇心驱使的自动红队测试:MIT学者教你如何让大模型避免产生仇恨或有害的输出

研究人员使用强化学习来训练红队模型,利用好奇心驱动探索的技术。红队模型被激励于对其生成的每个提示的后果保持好奇心,因此会尝试具有不同单词、句子模式...

纯C语言手搓GPT-2,前OpenAI、特斯拉高管新项目火了

Karpathy 表示,他选择从 GPT-2 开始,因为它是大语言模型的鼻祖,并且有可用的模型权重。项目的原始训练实现在 GitHub 上提供。项目在开始时一次性分配所有...

Google开源大模型新成员CodeGemma、RecurrentGemma,继Transformer后新架构Griffin诞生

CodeGemma 旨在为开发者和企业提供代码补全、生成和聊天服务。它利用 Gemma 模型的基础,为社区带来了强大而轻量级的编码能力。CodeGemma 的优势包括:- 智能...

如何看待第三代神经网络SNN?详解脉冲神经网络的架构原理、数据集和训练方法

摘要:本文深入探讨了脉冲神经网络(SNN)的原理、训练方法和评价指标。SNN作为第三代神经网络模型,旨在模拟大脑神经元动力学,与生物神经元机制更为接近。...

GPT时代学算法10,分类模型

在这篇文章中,作者小林coding介绍了机器学习中的分类问题,与回归问题不同,分类问题的预测结果是离散的类别。文章首先解释了分类问题的概念,包括二分类和...