从零开始手搓GPU，照着英伟达CUDA来，只用两个星期

AI最新资讯2个月前发布 tree

51 0 0

今日应用

Emoji表情素材

升级版的Emoji表情库，让你的聊天更有趣，表达更生动！

今日话题

从零开始手搓GPU，照着英伟达CUDA来，只用两个星期

重点标签 tag1、GPU、Verilog、自造芯片、开源EDA

文章摘要

摘要：

美国web3开发公司创始工程师Adam Majmudar分享了他从零开始构建GPU并成功的经历。Majmudar仅用两周时间完成了这一挑战，他的项目在GitHub上获得了5300的Star量。项目链接为：https://github.com/adam-maj/tiny-gpu。该项目目前处于Verilog中的芯片布局阶段，并通过OpenLane EDA软件进行了验证，预计将通过Tiny Tapeout 7交流片，成为物理形态的芯片。

Majmudar的设计流程包括了对GPU架构基础知识的学习，如CUDA框架、SIMD编程模式、全局内存、计算核心、分层缓存、内存控制器和程序调度等。他还深入了解了计算核心的主要单元，如寄存器、本地/共享内存、加载存储单元(LSU)、计算单元、调度程序、获取器和解码器。

为了简化GPU设计，Majmudar决定创建一个最小的GPU架构，突出GPU的核心概念，并消除不必要的复杂性。他强调了并行化、内存访问和资源管理三个方面，并专注于通用并行计算(GPGPU)功能，特别是面向机器学习的用例。

Majmudar为GPU编写了自定义的汇编语言，并设计了自己的11条小型指令ISA，受到LC4 ISA的启发。他还编写了两个矩阵数学内核，以证明GPU在图形和机器学习任务中的应用有效性。

在Verilog构建GPU的过程中，Majmudar遇到了许多问题，包括全局内存的实现、warp-scheduler的错误使用以及计算核心内调度的实现。他在美国知名黑客George Hotz的建议和帮助下，对设计进行了多次重写，最终实现了目标。

Majmudar的GPU设计通过OpenLane EDA流程转换为完整的芯片布局，并采用了Skywater 130nm工艺节点。他总结了“手搓芯片”的六个步骤，包括学习芯片架构和制造基础知识、电子设计自动化、Verilog电路设计、仿真和形式验证、以及使用OpenLane进行设计和优化。

此外，中国科学院大学在2020年公布了首期“一生一芯”计划的结果，由5位本科生主导完成了一款64位RISC-V处理器SoC芯片设计并实现流片，该项目也得到了RISC体系奠基人、图灵奖得主David Patterson教授的关注。

随着开源芯片和敏捷设计的发展趋势，芯片设计门槛逐渐降低，未来可能会看到更多自造芯片的实践。

文章来源

原文地址: 点我阅读全文
原文作者: 极市平台

文章版权归作者所有，未经允许请勿转载。

暂无评论

暂无评论...

从零开始手搓GPU，照着英伟达CUDA来，只用两个星期

今日应用

今日话题

文章摘要

文章来源

手部动作识别相关开源数据集汇总

微软宣布GPT-4o模型，可在 Azure OpenAI上使用

相关文章

暂无评论

热门网址

热门标签