6月26日,英特尔CEO陈立武在摩根大通全球科技媒体通信年会上抛出一个引发行业震动的判断:
"CPU与GPU的配置比例正从1:8向1:1调整,甚至可能反超。"
你没看错——过去两年被英伟达GPU统治的AI算力世界,正在被一个看似不起眼的东西颠覆:Token。
什么是Token?说白了,就是AI处理信息的最小单位。
你每问ChatGPT一个问题,它背后都要消耗成百上千个Token。
而到了AI智能体(Agent)时代,一个智能体要完成一个任务,Token消耗量最高可达单轮推理的1000倍。
这意味着什么?
优步的CTO今年4月直接摊牌了:开年没几个月,公司的AI预算已经用完了。
问题来了:Token烧得这么猛,钱都烧在了哪里?
答案是——绝大部分烧在了云端GPU上。
就在这个节骨眼上,英特尔跳出来说:你们别盯着GPU了,AI下一阶段的关键是CPU。
这事儿到底有多大?咱们来拆解一下。
根源揭示:企业用AI已经"烧不起"了
2026年5月22日,英特尔内部AI超级构建团队发布了一款名为SuperClaw(超级龙虾)的混合智能体方案。
这名字听着挺逗,但干的事儿一点不逗——它能让企业在AI工作流中节约高达70%的云端Token消耗。
你想想,一家中型企业每个月花在AI上的钱,突然砍掉七成,这是什么概念?
内部测试数据显示,单月可帮助中型企业节省约2.3万元AI运营成本。
这背后折射出一个残酷现实:企业用AI已经到了"烧不起"的地步了。
微软今年6月前要求体验与设备团队逐步停止使用Claude Code,转而使用自研的Copilot CLI,表面上是"支持自家产品",实际上就是个财务决策——省Token就是省钱。
而英伟达的应用深度学习副总裁更直白:
"我的团队里,用算力的花费已经远远超出公司支付给工程师的薪水。"
这哪是做AI?这分明是烧钱大赛。
更扎心的是,这种烧钱模式正在走向失控。
英特尔在COMPUTEX 2026上给出了一组数据:
传统AI是"一问一答"的单轮推理,而智能体是"思考、规划、行动、反思"的无限循环。
一个智能体的Token消耗量,最高可达单轮推理的1000倍。
这就是陈立武说的核心逻辑:智能体AI正在重塑数据中心的算力配比。
以前训练大模型,CPU和GPU的比例是1:8,GPU说了算。
但进入智能体推理模式后,CPU要负责任务编排、工具调用、数据迁移和系统协调,这些活儿GPU干不了,也干不起。
陈立武判断,这个比例正在迅速向1:1靠拢,甚至可能反超。
说白了,以前AI是"GPU一个人扛所有活",现在变成了"CPU当总指挥,GPU当乐手",各自干最擅长的事儿。
英特尔这套说辞,搁在一年前根本没人信。
2024年,英特尔净亏损高达188亿美元,股价跌去近60%,甚至被踢出了道琼斯指数。
当年8月,特朗普甚至发帖要求陈立武"立即辞职",理由是"严重利益冲突"。
但72小时后,剧情反转了——
陈立武单刀赴会面见特朗普后,后者态度180度大转弯,盛赞陈立武的故事"了不起"。
这个插曲,恰恰揭示了英特尔的底牌:它被当成了"美国半导体制造回流"的政治符号。
而陈立武这个人,也确实有两把刷子。
65岁临危受命,他做的第一件事就是扫除官僚体系。
他要求所有工程师直接向他汇报,习惯了"初创公司光速节奏"的他,把英特尔的决策链条砍掉了一半。
裁员是第二刀。
英特尔员工从2024年三季度的12.04万人,缩减到2026年一季度的8.32万人,净减少3.72万人,降幅超过30%。
粗略估算,每年能省下近100亿美元的人力成本。
第三刀是引入外部资本。
美国政府通过芯片法案注资89亿美元,成为第一大股东;英伟达出资50亿美元,软银投了20亿美元。
这一波"混改"加上资产甩卖,总共给英特尔注入了211亿美元救命钱。
效果如何?
截至2026年6月,英特尔股价从20.7美元冲高至132美元以上,累计涨幅超530%,市值从不足1000亿美元飙升至超6600亿美元。
陈立武在接受播客访谈时放了个大招:未来5到10年,要给股东实现10倍回报。
但故事远没有结束,真正的考验在代工业务上。
陈立武有句口头禅:"瓶颈在哪里,机会就在哪里。"
接手英特尔后,他面对的最大瓶颈是:传统芯片制程微缩越来越逼近物理极限。
线宽比头发丝还细,工艺节点越小,制造精度的要求就越高,任何一步出错都可能前功尽弃。
他的解法有两招:先进封装和新材料。
台积电有CoWoS,英特尔拿出了EMIB——下一代先进封装方案。
陈立武说,英特尔在模组领域拥有约1000项专利,如何把基板和模组整合好,是下一步的核心工程课题。
材料方面,他布局了氮化镓、碳化硅、磷化铟三个方向,还投资了一家玻璃基板公司——看中玻璃作为散热绝缘材料的独特性能。
更有意思的是,他还投了一家人工合成钻石晶圆公司,钻石能当隔热材料用。
这就像是一个工程师的直觉:遇到瓶颈,想办法绕过去或者跨过去。
但代工业务有个根本问题——信任。
陈立武自己都说,与台积电差距还很大,必须保持谦逊。
"代工是一门信任的生意,客户在把晶圆交给你之前,必须先信任你。一旦良率不达标,客户因营收损失而流失,将难以挽回。"
不过,转机正在到来。
今年4月,英特尔宣布加入马斯克主导的Terafab项目,落户德州奥斯汀,定位为全球最大规模的2nm先进芯片工厂。
陈立武透露,他每周都与马斯克团队开会,合作进展顺利。
更重磅的消息是,一周前特朗普公开爆料:苹果已同意与英特尔合作在美国本土设计和制造芯片。
尽管英特尔高管对消息提前曝光感到吃惊,但知情人士证实,两家公司的秘密谈判确实已持续数月。
一旦苹果、特斯拉这些"现象级客户"落地,英特尔代工业务将不再是"纸上谈兵"。
整个行业都在重新站队
说到这儿,你可能会问:英特尔这套"Token取代芯片"的逻辑,到底靠不靠谱?
咱们看几个数据。
华尔街投行伯恩斯坦近期将2030年全球服务器CPU市场规模预测,从1370亿美元大幅上调至2230亿美元,意味着未来5年将暴增近6倍。
AMD CEO苏姿丰也在5月宣布,将服务器CPU市场规模预测从600亿美元翻倍上调至1200亿美元以上。
连英伟达都坐不住了。
今年6月,黄仁勋亲自下场"推销"CPU,说"CPU是指挥家,GPU是乐团"。
摩根大通6月的报告更激进:最快到2027年,定制化ASIC芯片的出货量将首度超越英伟达的通用GPU。
英特尔在COMPUTEX 2026上展示的"完全解耦推理方案",就是冲着这个趋势去的。
在这个方案里,CPU、RDU、GPU各司其职,分别负责系统调度、解码和预填充,让每个推理阶段都在最合适的硬件上运行。
而面向端侧的第三代酷睿Ultra,则承担了另一项任务——让PC也能跑AI,减少对云端的依赖。
SuperClaw方案正是基于这个生态:本地处理敏感任务,云端处理高级推理,动态分配,既省钱又保护隐私。
IDC报告显示,2026年全球端云混合AI解决方案市场规模预计达到120亿美元,同比增长52%。
英特尔的算盘很清楚:
过去的AI时代是英伟达的GPU垄断,但进入智能体时代,算力需求不再是"堆卡"能解决的,需要系统级的协同优化。
而在这个新的分工体系里,CPU、边缘设备、定制芯片都会重新变得关键。
赌局才刚刚开始
陈立武在播客里说过一段话:
"过去你只是给人类提供服务器和PC,但现在有了另一个全新的维度——数以百万计的智能体需要访问算力,需要访问软件栈。我认为在智能体AI和物理AI这两个方向,英特尔都有机会,这场游戏还没结束。"
这句话值得琢磨。
AI发展到现在,大家突然发现:算力不是越多越好,而是用得对不对、省不省。
Token烧得越猛,谁能帮企业省Token,谁就有话语权。
英特尔赌的就是这个。
但赌局才刚刚开始。
18A制程的量产速度、至强6+的机架级方案能否快速落地、代工客户能不能真正信任英特尔——这些都是悬念。
陈立武给自己定了个目标:5到10年,10倍回报。
在他看来,"芯片巨头押注新赛道"这件事,成败远在2030年之后才会见分晓。
故事仍在继续,我们拭目以待。
热门跟贴