前阵子,在谷歌的协助下,加州大学圣地亚哥分校(UCSD)计划用2000台退役的Pixel手机组合起来搭建分布式计算平台。具体来说,他们要用2000台二手机组成一个庞大的云端服务器,把算力榨干,主打一个低碳环保。
看到这个新闻,我们的第一反应是:芯片和算力已经稀缺到这个程度了吗?同时,很多人肯定也会好奇:旧手机是如何变成服务器设备的?
在二手机上挖宝藏:芯片、存储都是宝贵资源
根据外媒The Register的报道,加州大学圣地亚哥分校前博士生Jennifer Switzer和谷歌达成了一项合作,她将谷歌提供的2000台Pixel Fold改造成分布式服务器。据了解,研究团队曾经尝试过直接把大量二手手机放在一起进行测试,但很快发现太多电池扎堆的话,会给数据中心带来火灾风险。
所以,Jennifer Switzer的方案先对这些二手手机进行改造,它们的电池和外壳会被移除,相机、通信模块等部件也被拆掉。说白了,二手手机用于搭建服务器,最核心的就是那块主板以及主板上的处理器、存储等核心部件。除了硬件层面的简化,软件层面,这些手机上的原生安卓系统也被卸载了,重新装上硬件开销更低的Linux。
接着,这些手机每25-50台会组成一个计算集群,多个集群再组成最终的规模化的服务器。那么,这么多手机如何相互连接和通信呢?手机原生的蜂窝网络和WiFi在这类场景中都没办法胜任,毕竟数千台设备之间的联网,足以让网络信号瘫痪。研究人员最终采用了配有有线网口的PCB板来解决联网问题,同时提供了统一的电源,保证多台设备都能稳定运行和连接。
看到这里,想必很多人都会疑惑:体积小巧、TDP有限的手机SoC,应付得了云端服务器的任务吗?毕竟,在大多人的想象中,服务器都是体积庞大的巨无霸,它们专门放置在超大空间的机房里。
其实,手机的算力,没有大家想得那么弱。谷歌的Pixel Fold是2023年发布的折叠屏产品,市场表现很一般,产品缺点也不少:价格昂贵、边框太宽、折痕明显。这款手机用的芯片是谷歌自研的Tensor G 2,综合性能大致介于骁龙888和骁龙8 Gen1之间,放在2023年来说也是比较落后的。
(图源:Google)
不过,近年手机行业太卷,芯片进化速度太快,普通用户看不上的「火龙」芯片,在服务器领域却是香饽饽。和手机这种移动端平台相比,服务器对芯片能耗和散热没有那么敏感。当Pixel Fold的主板拆掉外壳、接上电源后,等于能耗和发热问题都解决了。
而且,Tensor G2芯片包含Cortex-X1超大核和多个A78核心,性能已经超过了很多云服务商提供的入门VPS。更关键的是,谷歌这款芯片还集成了12GB内存,主板上还有256GB或者512GB的闪存,直接省去了存储方面的一大笔成本。
同时,Tensor G2设计之初就考虑到了AI应用场景,还集成了用于边缘计算的TPU,适合用来跑一些小型的本地模型。
当然,如果单独用一台Pixel Fold来搭服务器,还是很不现实,但2000台手机放一起来,集聚起来的算力就很夸张了。按照研究者透露的信息,现在即便20台手机组成的集群的算力,就能支撑75名学生线上提交作业的负荷。
AI带来的算力焦虑,能靠二手手机来缓解吗?
坦白说,指望用二手手机搭建的集群去跑千亿参数的大模型训练,无异于痴人说梦。但如果我们把目光从中心化的云端超算中心,转向去中心化的边缘计算,这就会是另外一番广阔天地了。
在雷科技(ID:leitech)看来,这种由退役手机组成的微型云厂,不仅不是算力降级,反而极其契合未来 AI 发展的两大核心诉求:低功耗与分布式低延迟。
首先,它缓解了日益严峻的AI高能耗问题。AI大模型的爆发固然带来了生产力的飞跃,但也带来了恐怖的能耗飙升问题。传统的集中式数据中心为了维持庞大算力集群的运转,需要消耗海量的电力进行冷却和供电。
而智能手机的SoC芯片,从诞生之初就将能效作为了核心指标。像Tensor G2这种自带TPU算力的移动端芯片,在剥离了屏幕、基带等耗电大户后,其纯计算的功耗远低于传统的x86服务器处理器。数千台这样的设备组合起来,不仅碳排放极低、环保,还能将庞大的算力需求化整为零。
(图源:Google)
其次,它很契合边缘计算的物理分布特性。随着各类AI Agent的演进和端侧应用场景的复杂化,未来的AI计算不再是把所有数据都一股脑打包上传到物理距离遥远的云端机房,而是更倾向于在靠近用户侧的边缘进行即时处理。
退役手机集群体积小巧、部署灵活,不再需要像传统机房那样要求苛刻的物理空间,它们完全可以部署在社区、校园、企业内部的微型节点中。这种物理距离上的拉近,极大地降低了数据传输的网络延迟,对于需要实时响应的AI推理、本地模型调度或是自动化工作流来说,算得上是量身定制。
最后,这也是一种破解算力成本与供应链焦虑的尝试。当下,存储和芯片的供应链价格波动频繁,硬件成本居高不下,而全球各地堆积如山的废旧手机不仅造成了资源浪费,还带来了电子垃圾污染。
将退役手机拆解重组,重塑为边缘计算的组成部分,相当于把曾经的电子垃圾转化为了低碳云算力节点。这无疑为缓解全球 AI 算力焦虑提供了一种成本更低、更具可持续性的破局新思路。
不过,这种微云厂模式虽然前景诱人,但其短板同样也比较明显。
一方面,手机SoC和存储的可靠性、寿命不如传统服务器端。手机上搭载的闪存和芯片,设计时设想的场景是普通消费者日常使用,而不会像企业级产品那样应对7×24小时不间断的高强度运行。由于手机存储颗粒和芯片直接封装在主板上,一旦出现故障,整个节点也就基本宣告死刑。
(Pixel Fold主板,图源:iFixit)
另一方面,旧手机组成的计算集群会面临后期维护问题。维护几台标准机架式服务器和维护2000块裸露、拼凑的手机主板,不是一个概念。庞大的微型节点基数意味着硬件故障率会被无限放大,如果频繁出现宕机,运维人员光进行物理排查和更换主板工作,就会耗费大量精力。
其实用旧手机集群来搭建服务器,这种设想前AI时代就有过,但因为投入产出比不划算被放弃。如今,这种方案再次被尝试,说白了就是我们开头说到的那个原因,存储、芯片成本都在暴涨,算力也有了稀缺性。现在如果用常规方案搭建服务器,成本比过去高得多。
同时,由于过去数年的极度内卷,手机行业淘汰下来的旧机型,数量极其庞大,客观上提供了相对廉价的物料,废旧机型的二次利用,无异于在电子垃圾里挖掘金矿。
写在最后
谷歌与加州大学圣地亚哥分校的这次尝试,与其说是一场算力革命,不如说是应对当下算力焦虑的一次极客实验。
身处存储价格狂飙、AI算力供不应求的大环境,大家习惯了将目光聚焦在动辄数万美元的顶级GPU上,忽略了海量闲置的移动端算力。虽然受限于闪存寿命等因素,这种二手手机拼凑的微型云厂注定无法取代传统数据中心的正规军,但它也为边缘计算提供了一个很有想象力的实操案例。
或许不远的未来,手机之外的二手平板、PC、游戏机、NAS等所有拥有算力的设备,都可能会被二次利用,相关的二手产业链将被重构。
热门跟贴