2026年下半年,企业数据中心将迎来一套奇怪的混搭方案:Intel的CPU、SambaNova的专用芯片,再加上别人家的GPU——三者被强行拧在一起,专门伺候AI推理这件事。
这不是实验室里的概念验证。Intel和SambaNova在周三扔出了一套"生产就绪"的异构推理架构,把原本由单一GPU包揽的活儿,拆成了三段流水线。拆得越细,越能绕开Nvidia的护城河。
三段式拆解:谁干什么活
这套架构的核心逻辑,是把AI推理粗暴地切成三个环节,每个环节交给最趁手的硬件。
第一段叫Prefill(预填充),负责吞下超长提示词、搭建键值缓存。这部分扔给AI GPU或加速器——Intel没明说,但言下之意是"这里可以用我们的Gaudi,也可以用别人的"。
第二段是Decode(解码),也就是真正一个字一个字往外蹦答案的环节。SambaNova的SN50 RDU(可重构数据流单元)独占这块。SN50的绝活是数据流架构,不像GPU那样被内存带宽卡脖子,在生成token这件事上反而更利索。
第三段交给Intel Xeon 6,干的是"杂活":代码编译执行、输出验证、跨硬件调度。SambaNova内部测试数据显示,Xeon 6的LLVM编译速度比Arm服务器CPU快50%以上,向量数据库性能比AMD EPYC高70%。
Intel和SambaNova的算盘很直白:Prefill和Decode阶段,GPU不是唯一解;但Agent相关的编排和工具调用,x86生态暂时没对手。与其在别人的主场硬碰硬,不如把自己能守住的阵地筑高。
30kW的隐形门槛
数据中心有个残酷的物理现实:功率密度。
Nvidia的H100/H200集群动辄要求40kW-60kW的机柜功率,液冷几乎是标配。这意味着大量存量数据中心要么推倒重建,要么眼睁睁看着算力饥渴却接不进新卡。
Intel和SambaNova的联合方案押注了一个数字:30kW。
SN50 RDU和Xeon服务器的组合,恰好能塞进这个功率 envelope(包络)。SambaNova官方口径是"绝大多数企业数据中心都能直接兼容",翻译过来就是:不用改配电、不用上液冷,插进去就能跑。
这是个被低估的切入点。云厂商和超大规模数据中心可以为了性能重新设计机房,但金融、制造、政务领域的"主权AI"项目往往被困在存量基础设施里。对他们来说,"能用"比"最快"更紧迫。
Agentic负载的特供赛道
两家公司在公告里反复念叨一个词:Agentic workloads(智能体负载)。
这不是凑 buzzword(流行词)。传统AI推理是"问一句、答一句",但代码Agent、研究Agent、多步骤决策Agent的工作流要复杂得多:调用工具、执行代码、验证结果、循环迭代。这种负载对CPU的通用计算能力和生态依赖极高——恰恰是Intel的舒适区。
SambaNova CEO Rodrigo Liang在声明里打了个比方:「数据中心的软件生态建立在x86之上,它运行在Xeon上——提供了一个成熟、经过验证的基础。」
这句话的潜台词是:GPU再强,也替代不了三十年来攒下的企业软件栈。编译器、调试器、安全审计工具、遗留系统集成——这些脏活累活,x86 CPU干了太久,换架构的成本高到离谱。
Intel选择在这里押注,算是认清了现实:和Nvidia在纯算力赛道肉搏是找死,但在"AI推理+企业IT"的交叉地带,还有缝隙可钻。
2026年的时间窗口
方案落地时间定在2026年下半年。这个节点耐人寻味。
Nvidia的Rubin架构(同样采用Prefill/Decode分离设计)预计2026年登场,但Rubin CPX(专用Prefill芯片)已经确认不会单独销售,只作为完整方案的一部分。Intel-SambaNova的组合则更像乐高积木:GPU部分可替换,RDU和Xeon固定搭配,给企业留了弹性空间。
另一个变量是SambaNova的融资节奏。这家由斯坦福教授Kunle Olukotun创立的芯片公司,2021年估值已超50亿美元,但和Cerebras、Groq一样,面临"技术领先、生态落后"的困境。绑定Intel的x86生态,是快速打开企业市场的捷径。
Intel这边,Gaudi 3的市场表现不温不火,Pat Gelsinger(帕特·基辛格)急需证明公司在AI时代还有牌可打。异构推理架构不追求单点突破,而是把CPU、加速器、第三方GPU串成链条——这种"系统集成商"的打法,倒符合Intel的历史基因。
谁在为这套方案买单
公告列出的目标客户很精准:企业、云运营商、主权AI项目。
云运营商可能是试水者——他们需要多样化供应链来压Nvidia的价。主权AI项目(欧洲、中东、部分亚太国家的政府主导AI基础设施)则是更确定的买家:数据不出境、硬件可审计、不依赖单一美国供应商,这三条红线让"混搭架构"反而成了优势。
企业市场的接受度最难预测。CIO们会算账:30kW的兼容性省下的基建成本,能否抵消多供应商管理的复杂度?SambaNova的RDU软件栈成熟度如何?这些问题的答案,要到2026年才能见分晓。
一个值得注意的细节:SambaNova的SN30(上一代RDU)已经在部分超算中心部署,但SN50的规模化商用尚无公开案例。技术参数漂亮,和"生产就绪"之间,往往隔着十八个月的血泪调试。
Intel和SambaNova的联合,像两个在Nvidia阴影下找活路的选手临时组队。一个出生态和渠道,一个出专用架构,共同赌一件事:AI推理的终局不是"一张卡打天下",而是"不同负载找不同硬件"的精细化分工。
这个赌局能赢吗?2026年下半年,第一批企业客户的电费账单和故障工单,会给出比任何分析师都诚实的答案。
热门跟贴