Nutanix押注3个新平台，把AI训练成本监控做到token级|nutanix|token|服务器|虚拟机|训练成本|调用

Nutanix在.NEXT大会上甩出一组数据：企业AI部署中，67%的项目因成本失控被迫缩减规模。这不是预测，是过去18个月客户反馈的统计结果。

这家公司选择用"一个平台"回应所有焦虑——从裸金属上的Kubernetes到跨云代理式AI（agentic AI），再到按token计费的监控粒度。产品副总裁Lee Caswell的原话是："客户不想再为'惊喜账单'买单。"

从虚拟机到裸金属：NKP Metal的野心

Nutanix Kubernetes Platform的新分支NKP Metal，瞄准的是一群特定用户：需要密集GPU配置做AI训练，又嫌弃虚拟化开销的团队。裸金属部署Kubernetes向来是运维噩梦——固件管理、服务器配置、生命周期维护，每一步都可能埋雷。

Caswell的解法是把Nutanix现成的自动化工具链移植过去。存储、网络、监控这些原本给虚拟机用的能力，现在直接作用于物理服务器。用户可以在同一套界面里，选择把工作负载放在虚拟机还是裸金属上，Nutanix称之为"双原生"架构。

这个架构的卖点在于灵活性而非性能极限。Caswell承认，纯裸金属方案在特定场景下延迟更低，但"大多数企业想要的是可预测性，而不是赌一把"。统一管理意味着安全策略、备份策略、合规审计可以跨环境复用，减少运维团队的认知负荷。

一个细节值得注意：NKP Metal支持从边缘到数据中心的同一套部署模板。对于需要在工厂车间和中央机房之间同步AI模型的制造业客户，这减少了重复造轮子的工作。

代理式AI的"房东模式"：neoclouds怎么玩

Nutanix对agentic AI的定义很务实——不是科幻片里的自主智能体，而是能调用工具、执行多步骤任务、在特定边界内做决策的企业应用。关键约束是"可治理"：谁启动了代理、访问了哪些数据、产生了多少成本，必须可追溯。

新发布的多租户能力，让"neoclouds"（按需提供AI基础设施的服务商）能把一套GPU集群切分给多个客户，同时保持隔离。Caswell描述了一个典型场景：某服务商采购了100块英伟达H100，通过Nutanix的管理层，可以按小时或按token卖给三家不同企业，每家看到的都是独占资源池。

这层管理能力的核心是按token计费的原生支持。大语言模型的调用成本波动极大，一次复杂的推理可能消耗数千token，而用户往往事后才发现。Nutanix把监控粒度下沉到这个层级，服务商可以设置预算上限，超支时自动降级到更小模型或触发审批。

Caswell提到一个早期客户的反馈：某金融公司在试点AI客服时，首月账单比预期高出340%，原因是测试团队没关掉的调试日志持续调用API。"token级监控让他们在第二周就发现了问题，而不是月底看报表时崩溃。"

混合多云的"体验层"：统一是手段，不是目的

Nutanix反复强调"one platform, one experience"，但Caswell的解释避开了技术整合的宏大叙事。他的原话是："体验一致意味着培训成本下降，意味着工程师从AWS跳槽过来不用重新考认证。"

具体落地在几个功能：跨云的Kubernetes联邦管理、统一的身份认证体系、以及即将推出的成本归因仪表盘。后者能把一笔云账单拆解到具体项目、具体团队、具体AI模型，满足FinOps（云成本优化）团队的刚需。

生态整合方面，Nutanix这次拉长了合作伙伴名单。重点不是数量，而是特定场景的覆盖——比如与某数据标注平台的深度集成，让AI训练流水线的数据准备环节也能纳入同一套治理框架。

一个容易被忽略的细节：所有新功能都支持"气隙部署"（air-gapped），即完全断网的本地环境。这对受监管行业（医疗、国防、部分金融）是硬门槛，也是Nutanix与公有云厂商的差异化空间。

硬件焦虑与供应链现实

发布会现场有分析师提问：GPU供应紧张会不会让这些规划落空？Caswell没有回避。他的回应是，Nutanix的自动化能力恰恰是为了提高现有硬件的利用率——"如果一块H100能从60%利用率提升到85%，相当于多买了40%的算力"。

平台支持异构GPU混插，包括AMD和英特尔的加速器。这不是技术炫耀，而是供应链风险的分散策略。某欧洲客户的案例被反复提及：他们在无法获得英伟达最新芯片的情况下，用Nutanix的调度层把旧款V100和新入手的MI300X混编成一个资源池，AI训练任务自动匹配最优硬件。

Caswell最后提到一个数字：Nutanix内部测算，采用新管理层的neoclouds客户，平均资源分配效率比传统裸金属方案提升22%。这个数字未经第三方审计，但方向与行业趋势一致——当AI算力成为稀缺商品，"榨干每一滴性能"比"追求理论最优"更务实。

发布会结束后的问答环节，有观众追问：当所有厂商都在讲"统一平台"，Nutanix的护城河到底是什么？Caswell的答案是时间——"我们在超融合架构上跑了12年，那些自动化脚本、故障处理手册、客户现场的corner case，不是抄个功能列表就能复制的。"

这个回答没有解决所有人的疑问。但至少在一件事上，Nutanix和它的客户达成了共识：AI基础设施的竞赛，正在从"谁能买到更多GPU"转向"谁能让GPU少闲置一会儿"。

Nutanix押注3个新平台，把AI训练成本监控做到token级

从虚拟机到裸金属：NKP Metal的野心

代理式AI的"房东模式"：neoclouds怎么玩

混合多云的"体验层"：统一是手段，不是目的

硬件焦虑与供应链现实

热搜

热门跟贴

从虚拟机到裸金属：NKP Metal的野心

代理式AI的"房东模式"：neoclouds怎么玩

混合多云的"体验层"：统一是手段，不是目的

硬件焦虑与供应链现实

热搜

热门跟贴

相关推荐

Meta员工空转AI只为浪费token！烧的多挣的多，日均消耗2万亿

爆火GitHub！《生化危机》女主打造免费“AI记忆系统”

全行业的「龙虾热」中，什么是AI Infra下半场的「神之一手」？

玄甲（AgentWard）全链路防御操作系统正式发布

以人为本的AI对用户而言才是最有用的AI

宏明电子：在精密零组件业务方面，公司相关服务器结构件产品已有小批量供货，但目前该业务整体规模较小

服务器堆叠≠超节点！超节点三大特点打破通信墙

省token神器3天狂揽4.1k星！19岁小哥开发，信息无损最高省87%

黑客voice38称没有因虚拟机破防还在努力攻破游戏

梦幻第六十三次服务器合并？连紫禁之巅都合区了？基本都三合一？

硕贝德：给中国台湾客户送样的部分服务器液冷板产品 目前正在测试中

阿里电商 AI 新动向：围绕 Token 重构电商，组织迎来新一轮调整

《龙腾世纪：审判》PS3版运营13年后宣布关服

全球油价飙升，比亚迪凭成本优势抢占海外市场红利

发售半年失守！《纪元117：罗马和平》D加密被破

霍尔木兹海峡已再次关闭

美国军工扩产导弹：产能提升背后的供应链隐忧剖析

中俄投下反对票！傅聪：不给使用武力开通行证

姑娘大街上直播跳舞，硬件条件太差了，想复制阿梓的路不可能

推理新范式：动态效能算法让算力资源实现最大化

硕贝德：给中国台湾客户送样的部分服务器液冷板产品目前正在测试中