打开网易新闻 查看精彩图片

Nutanix在.NEXT大会上甩出一组数据:企业AI部署中,67%的项目因成本失控被迫缩减规模。这不是预测,是过去18个月客户反馈的统计结果。

这家公司选择用"一个平台"回应所有焦虑——从裸金属上的Kubernetes到跨云代理式AI(agentic AI),再到按token计费的监控粒度。产品副总裁Lee Caswell的原话是:"客户不想再为'惊喜账单'买单。"

从虚拟机到裸金属:NKP Metal的野心

从虚拟机到裸金属:NKP Metal的野心

Nutanix Kubernetes Platform的新分支NKP Metal,瞄准的是一群特定用户:需要密集GPU配置做AI训练,又嫌弃虚拟化开销的团队。裸金属部署Kubernetes向来是运维噩梦——固件管理、服务器配置、生命周期维护,每一步都可能埋雷。

Caswell的解法是把Nutanix现成的自动化工具链移植过去。存储、网络、监控这些原本给虚拟机用的能力,现在直接作用于物理服务器。用户可以在同一套界面里,选择把工作负载放在虚拟机还是裸金属上,Nutanix称之为"双原生"架构。

这个架构的卖点在于灵活性而非性能极限。Caswell承认,纯裸金属方案在特定场景下延迟更低,但"大多数企业想要的是可预测性,而不是赌一把"。统一管理意味着安全策略、备份策略、合规审计可以跨环境复用,减少运维团队的认知负荷。

一个细节值得注意:NKP Metal支持从边缘到数据中心的同一套部署模板。对于需要在工厂车间和中央机房之间同步AI模型的制造业客户,这减少了重复造轮子的工作。

代理式AI的"房东模式":neoclouds怎么玩

代理式AI的"房东模式":neoclouds怎么玩

Nutanix对agentic AI的定义很务实——不是科幻片里的自主智能体,而是能调用工具、执行多步骤任务、在特定边界内做决策的企业应用。关键约束是"可治理":谁启动了代理、访问了哪些数据、产生了多少成本,必须可追溯。

新发布的多租户能力,让"neoclouds"(按需提供AI基础设施的服务商)能把一套GPU集群切分给多个客户,同时保持隔离。Caswell描述了一个典型场景:某服务商采购了100块英伟达H100,通过Nutanix的管理层,可以按小时或按token卖给三家不同企业,每家看到的都是独占资源池。

这层管理能力的核心是按token计费的原生支持。大语言模型的调用成本波动极大,一次复杂的推理可能消耗数千token,而用户往往事后才发现。Nutanix把监控粒度下沉到这个层级,服务商可以设置预算上限,超支时自动降级到更小模型或触发审批。

Caswell提到一个早期客户的反馈:某金融公司在试点AI客服时,首月账单比预期高出340%,原因是测试团队没关掉的调试日志持续调用API。"token级监控让他们在第二周就发现了问题,而不是月底看报表时崩溃。"

混合多云的"体验层":统一是手段,不是目的

混合多云的"体验层":统一是手段,不是目的

Nutanix反复强调"one platform, one experience",但Caswell的解释避开了技术整合的宏大叙事。他的原话是:"体验一致意味着培训成本下降,意味着工程师从AWS跳槽过来不用重新考认证。"

具体落地在几个功能:跨云的Kubernetes联邦管理、统一的身份认证体系、以及即将推出的成本归因仪表盘。后者能把一笔云账单拆解到具体项目、具体团队、具体AI模型,满足FinOps(云成本优化)团队的刚需。

生态整合方面,Nutanix这次拉长了合作伙伴名单。重点不是数量,而是特定场景的覆盖——比如与某数据标注平台的深度集成,让AI训练流水线的数据准备环节也能纳入同一套治理框架。

一个容易被忽略的细节:所有新功能都支持"气隙部署"(air-gapped),即完全断网的本地环境。这对受监管行业(医疗、国防、部分金融)是硬门槛,也是Nutanix与公有云厂商的差异化空间。

硬件焦虑与供应链现实

硬件焦虑与供应链现实

发布会现场有分析师提问:GPU供应紧张会不会让这些规划落空?Caswell没有回避。他的回应是,Nutanix的自动化能力恰恰是为了提高现有硬件的利用率——"如果一块H100能从60%利用率提升到85%,相当于多买了40%的算力"。

平台支持异构GPU混插,包括AMD和英特尔的加速器。这不是技术炫耀,而是供应链风险的分散策略。某欧洲客户的案例被反复提及:他们在无法获得英伟达最新芯片的情况下,用Nutanix的调度层把旧款V100和新入手的MI300X混编成一个资源池,AI训练任务自动匹配最优硬件。

Caswell最后提到一个数字:Nutanix内部测算,采用新管理层的neoclouds客户,平均资源分配效率比传统裸金属方案提升22%。这个数字未经第三方审计,但方向与行业趋势一致——当AI算力成为稀缺商品,"榨干每一滴性能"比"追求理论最优"更务实。

发布会结束后的问答环节,有观众追问:当所有厂商都在讲"统一平台",Nutanix的护城河到底是什么?Caswell的答案是时间——"我们在超融合架构上跑了12年,那些自动化脚本、故障处理手册、客户现场的corner case,不是抄个功能列表就能复制的。"

这个回答没有解决所有人的疑问。但至少在一件事上,Nutanix和它的客户达成了共识:AI基础设施的竞赛,正在从"谁能买到更多GPU"转向"谁能让GPU少闲置一会儿"。