今日应用
今日话题
英伟达神秘视频基础模型「Cosmos」曝光,数据全靠违规爬
重点标签 英伟达、视频模型、AI训练、版权争议、Cosmos项目
文章摘要
英伟达正在通过大规模抓取YouTube等来源的视频数据来训练其AI产品,包括Omniverse 3D世界生成器、自动驾驶汽车系统和”数字人”产品。这一行为引发了版权争议。据外媒404 Media报道,英伟达内部员工曾对使用禁止商用的数据集和YouTube视频提出法律担忧,但管理人员表示已获得高层批准。英伟达研究副总裁兼Cosmos项目负责人Ming-Yu Liu在邮件中表示,他们正在构建一个视频数据工厂,每天可产生相当于人类一生视觉体验的训练数据。
然而,YouTube和Netflix等平台的服务条款并不允许内容被抓取。YouTube CEO曾表示,使用YouTube视频训练AI违反其使用条款。Netflix发言人也表示,公司与英伟达未就内容采集达成协议。尽管如此,英伟达似乎并不在意这些法律问题,认为未经许可抓取视频是”行政决定”,员工不需要担心。
Cosmos项目的目标是构建一个最先进的视频基础模型,以推动英伟达的多种”杀手级”应用。项目成员正在用多种配置训练一个10亿参数的模型,并计划扩展到100亿参数。英伟达CEO黄仁勋对项目的进展表示肯定。
在法律监管明确之前,英伟达等科技巨头可能会继续利用法律灰色地带抓取受版权保护的数据,以推动其AI技术的发展。但这样的行为也引发了对版权保护和数据使用的讨论。
参考链接: [https://www.404media.co/nvidia-ai-scraping-foundational-model-cosmos-project/](https://www.404media.co/nvidia-ai-scraping-foundational-model-cosmos-project/)
文章来源
原文地址: 点我阅读全文
原文作者: 机器之心