2026年4月24日,英特尔股价单日暴涨23.6%,收于82.57美元,创下自1987年以来近40年的最大单日涨幅纪录,市值一夜暴增640亿美元,相当于涨出了一个AMD的体量 。
这轮史诗级暴涨的导火索是一份碾压性的Q1财报,营收136亿美元远超预期,调整后每股收益0.29美元,而华尔街预期仅为0.01美元,超预期幅度高达2800%。
英特尔CEO在电话会上说:「CPU正重新确立其作为AI计算栈核心基础层的地位。」这句话背后,是一个正在发生的产业范式转移。
AI发展不同阶段的CPU定位变化
AI早期训练阶段:CPU作为幕后调度者
在AI发展的早期,战场规则相对简单,GPU扮演着冲锋陷阵的士兵角色,以几千个核心的规模进行高频次的重复计算。此时的CPU犹如隐于幕后的将军,仅需进行少量的战术调度与后勤保障,两者的配比维持在8:1的悬殊状态 [1] 。
训练一个大模型需要喂海量数据让模型学习规律,几千张GPU每天24小时疯狂计算像几千个工人搬砖,CPU只负责告诉GPU哪批数据该算了,把数据从内存搬到GPU,监控训练是否正常。因为训练任务单一重复,GPU承担了绝大部分工作负载,CPU的职能相对有限。
推理普及阶段:CPU负载逐步提升
随着大模型从实验室里的训练走向屏幕前的推理,CPU的职责开始从单纯的后勤调度扩展至用户请求的排队与分发,配比随之收窄至4:1。
CPU接收用户的问题并格式化处理,把问题喂给GPU,把GPU的答案整理后返回给用户,处理多用户请求的排队和分发。 训练好的模型开始服务用户,用户在ChatGPT提问,模型回答用户。GPU根据用户的问题计算答案,每次推理都要跑一遍神经网络。用户基数的扩张同步推高了CPU的负载强度,CPU的需求开始增加。
AI Agent阶段:CPU权重发生根本性转变
而当AI Agent时代到来,CPU与GPU之间的权重关系发生了根本性转变。AI在回答问题之外,更承担了协助用户完成任务的职能,比如帮用户订机票、查日历、发邮件,分析财报、写报告、做决策,在多个软件之间跳转调用工具。
GPU和之前一样负责核心推理计算,但CPU要做任务规划,把帮我订机票拆解成10个子任务;做环境感知,读取日历、查航班信息、对比价格;做工具调用,调用订票API、支付系统;做状态管理,记住上一步做了什么下一步该做什么;做异常处理,如果支付失败换个支付方式重试;做结果整合,把多个步骤的结果汇总成报告。Agent的复杂度呈指数级上升,GPU还是做同样的事,但CPU的工作量翻了几倍。
假设用户要求AI分析苹果公司的财报。在传统的推理模式下,这仅仅是一次瞬时的计算交互:CPU接收指令,GPU快速生成答案,任务随即结束。整个过程耗时5秒,CPU工作很轻量。然而在智能体模式下,这演变成了一场多步骤的接力赛。CPU必须首先理解任务并将其拆解,随后在多次调用搜索工具、提取PDF数据、获取实时股价的过程中,不断在各个环节间进行决策与质量自检。在这个过程中,GPU依然负责核心的计算,但CPU的逻辑判断与工具调用的工作量已呈指数级增长,整个过程耗时5分钟,CPU工作非常密集。
英特尔在2026年首季财报中揭示了一个行业转折点,AI智能体时代促使每吉瓦CPU核心数激增至1.2亿,这种从1:8到1:1的配比演变,正是底层算力需求的真实写照。
CEO陈立武和CFO David Zinsner给出了明确的数据,训练阶段7-8个GPU配1个CPU,推理阶段3-4个GPU配1个CPU,智能体阶段接近1:1,每吉瓦CPU核心数从3000万增长了4倍 [1] 。
这份财报公布后,英特尔单日股价涨幅创下30多年来的新高,市场用真金白银投票确认了CPU价值重估的逻辑。与此同时,英伟达股价在同期受到了结构性调整的压力,并非因为GPU需求萎缩,而是市场开始重新评估算力蛋糕的分配方式。当AI基础设施建设从"GPU优先"转向"CPU-GPU协同平衡",整个半导体行业的估值体系都在随之重构。
行业与学术界的佐证
摩根士丹利在2026年4月的报告中预测,到2030年全球数据中心CPU市场规模将达到825-1100亿美元,其中325-600亿美元为Agentic AI带来的新增需求 [2] 。
在多步骤任务中CPU侧处理时间占整个工作负载的50%-90%,AI基础设施规模可能从2400亿美元增长至3-5万亿美元。Meta用真金白银投票,签约数十亿美元多年期协议采购亚马逊自研Graviton5 CPU核心,几周前刚签下480亿美元英伟达GPU租赁大单,Meta明确表示采购CPU是为了运行Agentic AI背后的CPU密集型工作负载 [3] 。
学术界的实测数据同样佐证了这一趋势,arXiv论文《Towards Understanding, Analyzing, and Optimizing Agentic AI Execution: A CPU-Centric Perspective》的实验数据显示,在RAG工作负载中,ENNS检索属于CPU操作,消耗了83%-89%的总延迟。Toolformer等工具调用场景CPU操作占主导,结论是工具主导的Agentic AI工作负载中CPU是主要瓶颈 [4] 。行业实测数据汇总显示,SemiWiki发现Agent系统中CPU处理复杂控制流时分支延迟是GPU的27倍以上 [7] ,英特尔白皮书指出推理场景CPU负责数据编排、任务调度等耗时占比超过60% [8] ,星宇智算实测发现GPU利用率低于40%时通常是CPU成为瓶颈,CSDN技术博客提到智能体任务链路中CPU时间占比50%-90%。
行业预测2026年CPU与GPU配比将快速收窄至1:1-1:2 [5] 。市场预测数据显示Deloitte预测推理工作负载2026年占AI计算三分之二 [6] ,Lenovo CEO杨元庆在CES 2026上表示历史上80%训练20%推理正在反转为80%推理20%训练,The Futurum Group预测推理收入2026年底超过训练。
CPU与GPU的关系
CPU与GPU并非零和博弈,两者通常是共同上升的,而非简单的此消彼长。因为AI推理负载的总量正在发生量级上的飞跃,所以即便CPU的配比在提升,GPU的绝对需求量依然在扩大。AI算力基础设施的总投入即Capex在未来几年呈指数级增长,即便在1:1的配比下,每一单位CPU的增加都对应着一单位GPU的部署,相比于之前的1:8,这只是意味着CPU变得更重要,并不代表GPU被弃用。GPU依然是处理神经网络计算的不可替代核心,其市场空间依然随着AI的普及而扩张。
GPU面临的是结构性调整而非总量衰减。虽然GPU不会因为CPU需求大涨而受损,但其增长的驱动力和产品形态会发生变化。从单纯算力向显存带宽竞争转移,在推理阶段GPU的瓶颈往往不在于算力有多强,而在于显存能不能跑赢,因此GPU厂商的竞争焦点会从核心数转向HBM高带宽显存容量。单位价值的重新分配,正如Meta虽然签了数十亿美元的CPU订单,但此前刚签下480亿美元的GPU租约,这说明在资本支出中GPU依然占据大头,只是CPU从可忽略的成本变成了必须重视的投入。逆向思考来看,还需要警惕像NVIDIA Grace这样的产品,它实质上是将高性能CPU直接封装在GPU模块内。特别是英伟达的反击能力极强,如果英伟达成功将CPU与GPU彻底绑定,例如GB200架构,那么CPU需求大涨的最终受益者可能依然是英伟达,而非传统CPU厂商。如果这种集成架构成为主流,传统的独立CPU厂商确实会面临压力,因为CPU的功能被GPU巨头顺手做掉了。
CPU价值重估的挑战与不确定性
当然,这条演进路径并非没有挑战。NVIDIA是否会坐视CPU分走预算值得思考,目前NVIDIA正在通过Grace CPU强化自家的CPU能力,或者通过CUDA库将原本属于CPU的逻辑调度任务进一步硬化到GPU侧。如果GPU厂商实现了更高效的异步调度,CPU的增量需求可能会被抵消,这个变量需要持续观察。
CPU价值重估是否只存在于数据中心是另一个值得思考的问题。在手机、PC等端侧NPU正在崛起,NPU可能会承接部分原本属于CPU的管理工作,这可能会削弱CPU在端侧Agent中的地位,端侧的架构演进路径可能与数据中心完全不同。
1:1的配比在商业上是否可持续需要打个问号。CPU核心数的激增意味着能耗和硬件成本大幅上升。如果企业为了控制成本,通过优化算法比如更小的模型、更简单的Agent链条来减少CPU的调用,那么1:1的配比可能只是一个理论峰值而非长期常态,成本约束始终是技术落地的重要考量。
任何技术架构的演进都无法绕开能效比这个核心命题。CPU核心数的翻倍增长必然带来功耗的同步上升,而数据中心的电力供给和散热能力始终存在物理上限。这意味着单纯追求1:1的配比值可能并非最优解,行业更可能在性能与功耗之间寻找一个动态平衡点。未来的计算架构可能呈现更加多元化的态势,不同场景下CPU、GPU、NPU甚至专用加速器的组合会有所不同,不存在一刀切的最优配比。算法层面的优化也会持续进行,更高效的调度算法、更简洁的Agent链路设计都可能降低对CPU硬件的依赖。
CPU价值重估的结论与国产机遇
因为AI Agent的运作本质上是逻辑链条的不断闭合与纠偏,而CPU的架构天然适合处理这种非线性的复杂逻辑,所以随着Agent复杂度的提升,CPU在算力架构中的占比必然会迎来回归。这种从算到想的重心偏移,决定了CPU厂商在2026年后将获得与GPU同等重要的战略地位。
2023-2024年训练爆发阶段最大受益者是NVIDIA GPU,CPU厂商处于边缘角色
2025-2026年推理普及阶段最大受益者是NVIDIA加云厂商,CPU厂商是配角
2026年及以后Agent爆发阶段,最大受益者是GPU加CPU,CPU厂商迎来重估机会
国产CPU的重估机会有着更深层的产业逻辑。Agent时代的核心特征是本地化数据处理和垂直领域深度适配,这恰恰击中了国产CPU的核心优势。在金融、政务、能源等关键行业,数据主权和安全合规是不可逾越的红线,国产CPU在处理本地化数据和垂直领域逻辑调度上,相比于通用架构有更强的主权确定性。龙芯、飞腾、海光、鲲鹏等国产厂商经过多年技术积累,在指令集自主可控、生态适配、行业定制化方面已经建立了坚实的护城河。当Agent成为企业级应用的主流形态,对数据本地化处理的需求将大幅提升,国产CPU凭借安全合规的先天优势,有望在政企市场获得远超通用市场的渗透率。这种垂直领域的结构性机会,是国产CPU在Agent时代独有的增长引擎。
但同时也需要清醒认识到,Agent时代异构计算的驱动适配,包括Driver与CUDA替代方案,依然是国产CPU的核心痛点,如果生态无法对齐,硬件冗余可能无法转化为实际效能。
核心逻辑在于Agent每多一个功能CPU就多一份工作,Agent越复杂CPU负载越重,CPU与GPU在算力架构中逐步走向协同平衡。受益方包括英特尔和AMD等CPU龙头,中国国产CPU包括龙芯、飞腾、海光、鲲鹏,以及需要重新设计CPU配比更高机型的服务器厂商。
Agent爆发促使CPU厂商迎来价值重估,但这种重估并非建立在削弱GPU的基础之上,而是在AI总负载扩张的背景下,修复CPU长期以来被低估的职能权重。这种重估并非线性的,而是伴随着技术路线的博弈、成本约束的挑战和架构多元化的演变。
在关注CPU配比上升的同时,也需要留意上述变量可能带来的预期差。
参考文献
[1]Intel Corporation. Intel Reports First-Quarter 2026 Financial Results [EB/OL]. 2026-04-24.
[2]Morgan Stanley Research. Data Center CPU Market Forecast: The Agentic AI Inflection [R]. 2026-04-19.
[3]Meta Platforms, Inc. Meta Signs Multi-Year Agreement with AWS for Graviton5 CPU Procurement [EB/OL]. 2026-04.
[4]Wang X, Li Y, et al. Towards Understanding, Analyzing, and Optimizing Agentic AI Execution: A CPU-Centric Perspective [J]. arXiv preprint arXiv:2511.00739v3, 2025.
[5]TrendForce. AI Server CPU-GPU Ratio Evolution: From Training to Agentic AI [R]. 2026-04.
[6]Deloitte. AI Compute Workload Forecast 2026: Inference Dominance [R]. 2026.
[7]SemiWiki. Branch Prediction Latency in Agent Systems: CPU vs GPU [EB/OL]. 2026.
[8]Intel Corporation. Data Center CPU White Paper: Orchestration and Scheduling in Inference Scenarios [R]. 2026.
作者:坦桑尼亚老云 | 编辑:栗加
每个视角都是拼凑世界真相的碎片,听真诚的行业观察者讲述独特的故事。我们有深耕行业的资深顾问,连续跨界探索的未来创业者,专注细节的产品匠人,和许多志同道合的你们,如果你有想要分享的故事或者感想,可以留言或者邮件联系(AiysJY@outlook.com),也欢迎点分享给需要的朋友们,记得点一下在看和星标,期待共同在这个行业的宏大叙事中,留下一句诗。:)
热门跟贴