太酷了!iPhone、iPad、MacBook老旧设备组成异构集群,能跑Llama 3

AI最新资讯3个月前发布 tree
25 0 0

今日应用


今日话题


太酷了!iPhone、iPad、MacBook老旧设备组成异构集群,能跑Llama 3
太酷了!iPhone、iPad、MacBook老旧设备组成异构集群,能跑Llama 3
 

重点标签 异构集群AI领域消费级硬件分布式推理模型优化

文章摘要


项目摘要:
通过使用消费级硬件设备,如iPhone、iPad和Macbook,可以构建一个异构集群推理方案,从而在AI领域实现更高效的模型运行。这个方案不仅限于特定操作系统,支持Windows、Linux、iOS,并且即将支持Android。项目作者@evilsocket展示了一个包含多种设备的集群,包括iPhone 15 Pro Max、iPad Pro、MacBook Pro (M1 Max)以及NVIDIA的高性能显卡。所有相关代码已经开源在GitHub上。

技术实现:
这一功能的实现依赖于一个名为Cake的Rust框架,它能够完成大模型的分布式推理,将不同操作系统的消费级硬件组合成一个集群。Cake框架的核心思想是将transformer块分片到多个设备上,使得那些通常无法在单个设备GPU内存中运行的模型能够进行推理。它通过分批处理连续的transformer块来最小化数据传输延迟。

使用指南:
用户首先需要安装Rust,然后通过运行特定的命令来编译和生成iOS绑定。使用时,需要运行worker节点和master节点,通过指定模型路径、工作模式、节点名称、拓扑文件和绑定地址来配置集群。topology.yml文件定义了哪些层由哪个worker提供服务。此外,为了优化内存和磁盘空间,可以使用cake-split-model工具仅向worker提供模型中实际需要的数据部分。

AIGC体验派:
7月17日,《AIGC体验派》第五期将探讨AIGC在营销领域的创新与安全问题,包括如何避免大语言模型的不当言论、确保创作内容的质量和安全,以及防止营销活动被不当利用。观众可以通过识别海报上的二维码或点击阅读原文报名参加直播。

版权声明:
文章版权归机器之心所有,转载需联系本公众号获得授权。投稿或寻求报道可通过content@jiqizhixin.com联系。

文章来源


原文地址: 点我阅读全文
原文作者: 机器之心

© 版权声明

相关文章

暂无评论

暂无评论...