打开网易新闻 查看精彩图片

2025年,全球主要云服务商出货的算力里,Arm架构占了接近一半。AWS Graviton、Google Axion、微软自研AI芯片——这些名字背后是一套完整的AI软件生态:PyTorch、TensorFlow、llama.cpp、ONNX Runtime,全为Arm原生优化。同一时期,全球银行、保险、政府机构的核心交易系统,仍运行在IBM Z大型机上,用的是IBM自家的s390x架构。两套体系,中间隔着一道移植成本的高墙。

这道墙的存在,让AI推理"靠近数据"成了空话。数据在大型机里,AI模型在Arm云服务器上,中间要么跨架构移植(慢且贵),要么把数据搬出去(合规不允许)。4月2日,IBM和Arm宣布战略合作,目标直戳这个痛点:让Arm原生软件直接跑在IBM Z和LinuxONE上。

为什么是现在:Arm算力占比逼到临界点

为什么是现在:Arm算力占比逼到临界点

Arm的渗透速度比多数人想象的快。按Arm自己的统计,2025年发往全球头部云厂商的算力芯片,Arm架构占比逼近50%。AWS第三代Graviton、Google Axion处理器、微软为AI基础设施定制的芯片——三巨头的新增算力投资,Arm已成默认选项。

这个比例背后是软件生态的迁移。Arm把Kleidi AI库直接集成进PyTorch、ExecuTorch、ONNX Runtime等主流框架,意味着开发者写AI应用时,Arm是"开箱即用"的默认优化目标。反观s390x,每次框架更新都要单独移植,进度永远慢半拍,成本还要企业自己扛。

IBM Z客户的处境因此变得尴尬。他们的系统承载着全球大部分受监管的企业交易——银行核心账务、保险精算、政府社保——这些数据因合规要求无法上公有云。但AI应用开发团队用的工具链, increasingly 是为Arm云环境设计的。两边各说各话,中间没有翻译器。

IBM和Arm的联手,本质是给这个僵局找一个不拆基础设施的解法。不是让银行把核心系统搬到云上,而是让云原生的AI工具能直接落地到大型机本地。

合作的三条战线:虚拟化、安全、长期兼容

合作的三条战线:虚拟化、安全、长期兼容

双方把合作拆成三个工作流。第一个是虚拟化层:在IBM硬件上托管Arm软件环境。技术细节未公开,但方向明确——让Arm二进制应用无需重新编译就能在Z系列上运行,或至少大幅降低移植门槛。

第二个是安全与合规。这是IBM Z的看家本领,也是Arm生态相对薄弱的环节。金融监管机构对AI模型的可审计性、数据处理的留痕要求,公有云环境往往难以满足。合作的目标是把Arm AI工具链"包裹"进IBM Z已有的合规框架里,让银行既能用新工具,又不触发审计警报。

第三个是长期生态互操作。双方强调这是"未来方向和意图",没有产品发布时间表。翻译过来:架构层面的整合需要多年,但两家要先锁定彼此,防止生态进一步分裂。

IBM没有给出任何交付日期。这种模糊在大型机领域并不罕见——Z系列的客户规划周期以十年计,供应商承诺的是路线图而非 deadline。

谁更急:Arm要企业市场,IBM要AI门票

谁更急:Arm要企业市场,IBM要AI门票

这笔合作的不对称性值得玩味。Arm的急切写在脸上:50%的云算力份额之后,下一个增长极只能是企业核心系统。但银行、政府的大型机采购周期长达5-7年,芯片架构一旦锁定就是十年以上的绑定。Arm如果错过这一轮换机窗口,下一个机会要等到2030年代。

IBM的焦虑更隐蔽。Z系列的可靠性口碑仍在,但AI时代的叙事权正在流失。当企业CTO讨论"AI战略"时,想到的是云厂商的模型服务、GPU集群、MLOps平台——大型机在这些对话里隐身了。IBM需要证明,核心交易系统不是AI时代的遗迹,而是可以就地智能化的资产。

双方的算盘都指向同一个结论:与其让企业二选一,不如让两种架构在同一台机器里共存。这不是技术浪漫主义的产物,而是各自商业困境的交汇点。

未解的问题:性能损耗与生态主导权

未解的问题:性能损耗与生态主导权

合作声明留下大量空白。虚拟化层的具体实现方式——是二进制翻译、容器封装,还是硬件辅助模拟——将直接决定性能损耗程度。AI推理对延迟敏感,如果虚拟化 overhead 超过15%,金融实时交易场景可能无法接受。

更深层的疑问是生态主导权。Arm的Kleidi库正在成为AI框架的默认优化路径,IBM是拥抱这个标准,还是试图在Z系列上维护一套并行优化?声明中的"长期互操作"措辞暧昧,既可能是深度整合,也可能是最低限度的兼容。

还有一条暗线:英伟达。IBM Z近年来与英伟达合作紧密,部分型号已集成GPU用于AI加速。Arm合作是否会影响这条线的投入强度?三方博弈的格局尚未明朗。

企业客户的反馈将是关键变量。大型机用户的决策链条极长,但一旦被说服,替换成本也极高——这意味着先发优势可以锁定十年以上的供应关系。IBM和Arm的下一步,是拿出足够具体的试点案例,让某个大型银行愿意公开站台。

第一个这样的案例会出现在哪个国家、哪类业务场景——是反欺诈实时评分,还是合规文档的自动化处理?这或许是观察合作真实进展的最可靠指标。