酷！Phone、iPad、MacBook老旧设备组成异构集群，能跑Llama 3|ios|ipad|iphone|macbook|安卓|异构集群

机器之心报道

机器之心编辑部

假如你有闲置的设备，或许可以试一试。

这次，你手里的硬件设备也能在 AI 领域大展拳脚了。

将 iPhone、iPad、Macbook 进行组合，就能组装成「异构集群推理方案」，然后顺畅的运行 Llama3 模型。

值得一提的是，这个异构集群可以是 Windows 系统，也可以是Linux、iOS 系统，并且对 Android 的支持很快到来。

异构集群正在运行中。

根据项目作者 @evilsocket 的介绍，这个异构集群包括 iPhone 15 Pro Max、iPad Pro、MacBook Pro (M1 Max)、NVIDIA GeForce 3080、2x NVIDIA Titan X Pascal。所有代码都已经上传到 GitHub。

看到这，网友纷纷表示，这位老哥确实不简单。

不过也有网友开始担心能耗问题，暂且不管速度，电费都耗不起。来回搬数据，损耗太大了。

项目介绍

上述功能的实现，离不开一个名为 Cake 的 Rust 框架。Cake 可以完成大模型（例如 Llama3）的分布式推理，旨在将消费级硬件组合成异构集群，其中消费级硬件采用多种操作系统，包括：iOS、Android、macOS、Linux 和 Windows，从而使 AI 更易于访问。

项目地址：https://github.com/evilsocket/cake

Cake 的主要思路是将 transformer 块分片到多个设备，以便能够让通常不适合单个设备 GPU 内存的模型运行推理。对同一工作线程上的连续 transformer 块的推理是分批进行的，以便最大限度地减少数据传输造成的延迟。

Cake 目前支持的系统和设备如下：

编译

安装 Rust 后，运行下列代码：

cargo build --release

假如用户想要在应用程序中生成 iOS 绑定，可以进行下述操作：

make ios

使用

运行 worker 节点：

cake-cli --model /path/to/Meta-Llama-3-8B \ # model path, read below on how to optimize model size for workers

--mode worker \ # run as worker

--name worker0 \ # worker name in topology file

--topology topology.yml \ # topology

--address 0.0.0.0:10128 # bind address

运行 master 节点：

cake-cli --model /path/to/Meta-Llama-3-8B \

--topology topology.yml

其中 topology.yml 确定哪些层由哪个 worker 提供服务：

linux_server_1:

host: 'linux_server.host:10128'

description: 'NVIDIA Titan X Pascal (12GB)'

layers:

- 'model.layers.0-5'

linux_server_2:

host: 'linux_server2.host:10128'

description: 'NVIDIA GeForce 3080 (10GB)'

layers:

- 'model.layers.6-16'

iphone:

host: 'iphone.host:10128'

description: 'iPhone 15 Pro Max'

layers:

- 'model.layers.17'

ipad:

host: 'ipad.host:10128'

description: 'iPad'

layers:

- 'model.layers.18-19'

macbook:

host: 'macbook.host:10128'

description: 'M1 Max'

layers:

- 'model.layers.20-31'

关于内存和磁盘空间优化问题，用户可能希望只向 worker 提供模型中实际需要的数据，而不是整个文件夹，在这种情况下，可以使用 cake-split-model 。例如，要生成较小版本的 llama3 safetensors，可以采用如下代码：

cake-split-model --model-path path/to/Meta-Llama-3-8B \ # source model to split

--topology path/to/topology.yml \ # topology file

--output output-folder-name

参考链接：https://x.com/tuturetom/status/1812654489972973643

酷！Phone、iPad、MacBook老旧设备组成异构集群，能跑Llama 3

热搜

热门跟贴

热搜

热门跟贴

相关推荐

小米多款手机可升级基于Android 16的澎湃OS 有你的吗？

三星概念机展示，要是用这手机，跟穿内裤出门没区别

高端机“搅局者”，巨犀玻璃+卫星通信，16GB+512GB突降千元

苹果生产线拆除，曾经1天2万台手机，终于退回三十年前了！

仰望u9车内视角原地起跳，想起了当年的山寨机，各种花哨功能！

当姐姐换了新手机，家中开启了手机继承仪式

300万的跑步机，真是活久见，足不出户还能玩这么多花样！

老A8的性能还在提升

引入云雾仓新设计理念，瓷音未来的Mars Pro颜值性能双开花

6.75英寸大屏、6100mAh，消费降级下的“大码”手机

大码配置、结实耐用，“朴实无华”的手机推荐

就算换手机，也舍不得删除的6个小众APP，硬核又实用

丈夫手机偷看美女，媳妇偷袭切换自如，论处理器的重要性！

电车你就选特斯拉，手机你就选苹果，保证不会吃亏上当！

体验了Rokid AR Lite，我要和iPad Pro说拜拜

满配+超大OLED屏幕，小米第一款“刘海屏”旗舰平板来了

垄断真可怕！RTX 5090、5080售价再曝光：英伟达让两者相差近万元

曾经的真旗舰笔记本没了！准系统电脑彻底凉凉，你用过吗？

我，500元买了台谷歌版Mac mini，居然能畅玩LOL？

17.5万，太凶残了