打开网易新闻 查看精彩图片

SUSE Rancher和Vultr最近搞了个大动作。两家公司宣布合作,要把AI基础设施从超大规模云厂商手里「解放」出来。

这事的核心数字很扎眼:AWS、Azure、GCP三家吃掉全球云市场67%份额。AI训练成本里,算力租赁能占到60%以上。中小团队想跑个大模型,先得给云厂商交「过路费」。

这场合作的底层逻辑,像是给AI开发者发了一把「万能钥匙」。

SUSE Rancher提供Kubernetes(容器编排平台)管理能力,Vultr提供裸金属服务器和GPU实例。组合起来的效果:开发者可以在非超大规模云的基础设施上,一键部署AI工作负载。

Vultr的定价策略直接对标头部云厂商的「骨折价」。他们的A100 GPU实例,小时定价大约是AWS同规格的40%-50%。

SUSE Rancher Prime 2.10版本的关键更新,是内置了对Vultr云的原生支持。用户界面里直接出现Vultr的选项,点几下就能拉起集群。

「越狱」的技术底气从哪来

「越狱」的技术底气从哪来

Kubernetes生态的成熟度,是这场合作的隐形筹码。

过去五年,容器化已经成为AI训练的事实标准。PyTorch、TensorFlow这些框架,早就原生支持K8s调度。这意味着迁移成本被压得很低——不是从零造轮子,而是换条跑道。

Vultr的全球节点布局也在加速。目前32个数据中心,覆盖六大洲。对需要数据驻留合规的企业,这比头部云厂商的「标准套餐」更灵活。

SUSE的算盘打得更远。Rancher作为多云管理平台,核心价值是「不站队」。这次接入Vultr,是在强化「任何基础设施都能管」的定位。

他们的产品文档里有个细节:同一套Rancher控制台,可以同时管理AWS、Azure、Vultr和本地数据中心的集群。

这种「骑墙」策略,恰恰是当下企业最需要的。

超大规模云的「税」有多重

超大规模云的「税」有多重

算笔具体的账。

训练一个70B参数的LLM,在AWS上用p4d.24xlarge实例,单次训练成本约120-150万美元。换成Vultr的裸金属GPU方案,同等工作负载能压到60-80万美元。

差距不只是硬件租金。头部云厂商的AI服务栈——SageMaker、Azure ML、Vertex AI——都是「甜蜜陷阱」。用深了,数据、模型、流水线全锁死在生态里。

SUSE Rancher的解法很产品经理思维:把「基础设施选择权」交还给用户。用开源工具链替代托管服务,用多云策略对冲锁定风险。

Vultr CEO J.J. Kardwell的原话:「企业厌倦了为不需要的复杂性付费。」

谁真的会「越狱」

谁真的会「越狱」

第一批吃螃蟹的,可能是这几类人。

预算敏感的AI初创公司。融资环境收紧的2024年,能省40%的算力开支,直接决定能多跑几轮实验。

有合规刚需的金融、医疗企业。数据不出境是硬约束,Vultr的区域节点比AWS的「中国特供版」更轻量。

已经在用混合云架构的中大型企业。Rancher的多云管理能力,正好填补「非主流云厂商」的管理空白。

但挑战也很现实。Vultr的品牌认知度远低于AWS,企业采购部门的「安全牌」惯性很难打破。SUSE Rancher虽然技术口碑不错,但市场份额被Red Hat OpenShift和VMware Tanzu挤压得厉害。

这场合作的真正考验,不是技术可行性,而是能不能让企业相信「便宜也有好货」。

目前Vultr的AI基础设施客户里,已经有几家独角兽在低调使用。具体名字没公开,但SUSE的人透露「包括一家估值超过50亿美元的生成式AI公司」。

如果这个数字属实,说明「越狱」已经从边缘实验走向主流验证。