今日应用
今日话题
老黄一口气解密三代GPU!粉碎摩尔定律打造AI帝国,量产Blackwell解决ChatGPT全球耗电难题
重点标签 Blackwell芯片、GPT-4能耗降低、摩尔定律、加速计算、AI工厂
文章摘要
在最近的一次演讲中,英伟达的CEO黄仁勋展示了Blackwell芯片,这是一款迄今为止世界上最大的芯片,被他誉为“全世界迄今为止制造出来的最复杂、性能最高的计算机”。他宣布,在未来8年内,他们计划将1.8万亿参数的GPT-4模型的训练能耗降低至原来的1/350,推理能耗则降低至1/45000,这一进步预示着英伟达的产品迭代速度已经超越了摩尔定律。
黄仁勋在演讲中强调了加速计算的重要性,他指出,随着计算需求的指数级增长,传统的处理器性能扩展已经放缓,而英伟达通过CUDA和GPU的异构计算,实现了计算速度的显著提升,同时保持了较低的能耗和成本增长。他还提到,英伟达的加速计算技术已经帮助全球的公司在云端数据处理上节省了数亿美元。
英伟达不仅在硬件上取得了突破,还在软件层面进行了创新。黄仁勋展示了Blackwell后三代的路线图,包括Blackwell Ultra、Rubin和Rubin Ultra,这些产品将在2025年至2027年间陆续推出。他还提到了“买得越多,省得越多”的黄式数学公式,预示着未来计算成本的进一步降低。
在AI领域,英伟达通过深度学习、物理模拟、通信、基因序列、量子计算模拟和数据处理等多个领域的CUDA软件,推动了AI技术的发展。谷歌最近宣布将cuDF加入谷歌云,加速了Pandas这一受欢迎的数据科学库,展示了数据处理速度的显著提升。
此外,英伟达还展示了其在AI工厂方面的进展,包括Tensor Core、NvLink、TensorRT、Triton推理服务器和DGX超算等技术。黄仁勋提到,2016年他们将首个DGX超算送给了OpenAI,此后英伟达不断扩大其在AI领域的影响力。2022年,英伟达训练出的ChatGPT模型展示了生成式AI的能力,能够输出图像、语音、文字、视频等多种类型的token。
Blackwell芯片的推出,标志着英伟达在AI领域的进一步发展。这款芯片通过技术创新,如更大的芯片尺寸、10TB/s的链路链接、第二代GPU的高度安全性、第五代NVLink技术等,为AI模型的训练和推理提供了强大的支持。Blackwell芯片的推出,将使得训练大型AI模型的能耗大幅降低,同时提高了模型的运行效率和可靠性。
英伟达还展示了其在服务器领域的创新,包括风冷的DGX Blackwell和液冷的MGX系统。这些系统通过集成Blackwell芯片,实现了能耗和性能的显著提升。NVLink技术的应用,使得GPU之间的通信更加高效,为构建大型AI超算提供了可能。
黄仁勋还提到了英伟达在网络技术方面的进展,包括基于以太网的AI超算适配交换机,这些技术将有助于数据中心顺利过渡到AI时代。此外,英伟达还推出了NIM软件,为开发者提供了一种简单、标准化的方式来构建生成式AI应用程序,大幅提高了开发者的生产力。
最后,黄仁勋展望了智能体和数字人在未来应用中的潜力,以及英伟达在这些领域的技术布局。他还预告了下一代芯片Rubin的推出,以及英伟达在数字孪生地球和具身AI机器人等前沿项目上的进展。通过这些技术创新,英伟达正在开启一个全新的计算时代,推动AI技术的发展和应用。
文章来源
原文地址: 点我阅读全文
原文作者: AIGC新智界