CPU在推理时代的价值重估：从英特尔的30年单日涨幅说起|amd|gpu|推理|知名企业|英伟达|英特尔

2026年4月24日，英特尔股价单日暴涨23.6%，收于82.57美元，创下自1987年以来近40年的最大单日涨幅纪录，市值一夜暴增640亿美元，相当于涨出了一个AMD的体量。

这轮史诗级暴涨的导火索是一份碾压性的Q1财报，营收136亿美元远超预期，调整后每股收益0.29美元，而华尔街预期仅为0.01美元，超预期幅度高达2800%。

英特尔CEO在电话会上说：「CPU正重新确立其作为AI计算栈核心基础层的地位。」这句话背后，是一个正在发生的产业范式转移。

AI发展不同阶段的CPU定位变化

AI早期训练阶段：CPU作为幕后调度者

在AI发展的早期，战场规则相对简单，GPU扮演着冲锋陷阵的士兵角色，以几千个核心的规模进行高频次的重复计算。此时的CPU犹如隐于幕后的将军，仅需进行少量的战术调度与后勤保障，两者的配比维持在8:1的悬殊状态 [1] 。

训练一个大模型需要喂海量数据让模型学习规律，几千张GPU每天24小时疯狂计算像几千个工人搬砖，CPU只负责告诉GPU哪批数据该算了，把数据从内存搬到GPU，监控训练是否正常。因为训练任务单一重复，GPU承担了绝大部分工作负载，CPU的职能相对有限。

推理普及阶段：CPU负载逐步提升

随着大模型从实验室里的训练走向屏幕前的推理，CPU的职责开始从单纯的后勤调度扩展至用户请求的排队与分发，配比随之收窄至4:1。

CPU接收用户的问题并格式化处理，把问题喂给GPU，把GPU的答案整理后返回给用户，处理多用户请求的排队和分发。训练好的模型开始服务用户，用户在ChatGPT提问，模型回答用户。GPU根据用户的问题计算答案，每次推理都要跑一遍神经网络。用户基数的扩张同步推高了CPU的负载强度，CPU的需求开始增加。

AI Agent阶段：CPU权重发生根本性转变

而当AI Agent时代到来，CPU与GPU之间的权重关系发生了根本性转变。AI在回答问题之外，更承担了协助用户完成任务的职能，比如帮用户订机票、查日历、发邮件，分析财报、写报告、做决策，在多个软件之间跳转调用工具。

GPU和之前一样负责核心推理计算，但CPU要做任务规划，把帮我订机票拆解成10个子任务；做环境感知，读取日历、查航班信息、对比价格；做工具调用，调用订票API、支付系统；做状态管理，记住上一步做了什么下一步该做什么；做异常处理，如果支付失败换个支付方式重试；做结果整合，把多个步骤的结果汇总成报告。Agent的复杂度呈指数级上升，GPU还是做同样的事，但CPU的工作量翻了几倍。

假设用户要求AI分析苹果公司的财报。在传统的推理模式下，这仅仅是一次瞬时的计算交互：CPU接收指令，GPU快速生成答案，任务随即结束。整个过程耗时5秒，CPU工作很轻量。然而在智能体模式下，这演变成了一场多步骤的接力赛。CPU必须首先理解任务并将其拆解，随后在多次调用搜索工具、提取PDF数据、获取实时股价的过程中，不断在各个环节间进行决策与质量自检。在这个过程中，GPU依然负责核心的计算，但CPU的逻辑判断与工具调用的工作量已呈指数级增长，整个过程耗时5分钟，CPU工作非常密集。

英特尔在2026年首季财报中揭示了一个行业转折点，AI智能体时代促使每吉瓦CPU核心数激增至1.2亿，这种从1:8到1:1的配比演变，正是底层算力需求的真实写照。

CEO陈立武和CFO David Zinsner给出了明确的数据，训练阶段7-8个GPU配1个CPU，推理阶段3-4个GPU配1个CPU，智能体阶段接近1:1，每吉瓦CPU核心数从3000万增长了4倍 [1] 。

这份财报公布后，英特尔单日股价涨幅创下30多年来的新高，市场用真金白银投票确认了CPU价值重估的逻辑。与此同时，英伟达股价在同期受到了结构性调整的压力，并非因为GPU需求萎缩，而是市场开始重新评估算力蛋糕的分配方式。当AI基础设施建设从"GPU优先"转向"CPU-GPU协同平衡"，整个半导体行业的估值体系都在随之重构。

行业与学术界的佐证

摩根士丹利在2026年4月的报告中预测，到2030年全球数据中心CPU市场规模将达到825-1100亿美元，其中325-600亿美元为Agentic AI带来的新增需求 [2] 。

在多步骤任务中CPU侧处理时间占整个工作负载的50%-90%，AI基础设施规模可能从2400亿美元增长至3-5万亿美元。Meta用真金白银投票，签约数十亿美元多年期协议采购亚马逊自研Graviton5 CPU核心，几周前刚签下480亿美元英伟达GPU租赁大单，Meta明确表示采购CPU是为了运行Agentic AI背后的CPU密集型工作负载 [3] 。

学术界的实测数据同样佐证了这一趋势，arXiv论文《Towards Understanding, Analyzing, and Optimizing Agentic AI Execution: A CPU-Centric Perspective》的实验数据显示，在RAG工作负载中，ENNS检索属于CPU操作，消耗了83%-89%的总延迟。Toolformer等工具调用场景CPU操作占主导，结论是工具主导的Agentic AI工作负载中CPU是主要瓶颈 [4] 。行业实测数据汇总显示，SemiWiki发现Agent系统中CPU处理复杂控制流时分支延迟是GPU的27倍以上 [7] ，英特尔白皮书指出推理场景CPU负责数据编排、任务调度等耗时占比超过60% [8] ，星宇智算实测发现GPU利用率低于40%时通常是CPU成为瓶颈，CSDN技术博客提到智能体任务链路中CPU时间占比50%-90%。

行业预测2026年CPU与GPU配比将快速收窄至1:1-1:2 [5] 。市场预测数据显示Deloitte预测推理工作负载2026年占AI计算三分之二 [6] ，Lenovo CEO杨元庆在CES 2026上表示历史上80%训练20%推理正在反转为80%推理20%训练，The Futurum Group预测推理收入2026年底超过训练。

CPU与GPU的关系

CPU与GPU并非零和博弈，两者通常是共同上升的，而非简单的此消彼长。因为AI推理负载的总量正在发生量级上的飞跃，所以即便CPU的配比在提升，GPU的绝对需求量依然在扩大。AI算力基础设施的总投入即Capex在未来几年呈指数级增长，即便在1:1的配比下，每一单位CPU的增加都对应着一单位GPU的部署，相比于之前的1:8，这只是意味着CPU变得更重要，并不代表GPU被弃用。GPU依然是处理神经网络计算的不可替代核心，其市场空间依然随着AI的普及而扩张。

GPU面临的是结构性调整而非总量衰减。虽然GPU不会因为CPU需求大涨而受损，但其增长的驱动力和产品形态会发生变化。从单纯算力向显存带宽竞争转移，在推理阶段GPU的瓶颈往往不在于算力有多强，而在于显存能不能跑赢，因此GPU厂商的竞争焦点会从核心数转向HBM高带宽显存容量。单位价值的重新分配，正如Meta虽然签了数十亿美元的CPU订单，但此前刚签下480亿美元的GPU租约，这说明在资本支出中GPU依然占据大头，只是CPU从可忽略的成本变成了必须重视的投入。逆向思考来看，还需要警惕像NVIDIA Grace这样的产品，它实质上是将高性能CPU直接封装在GPU模块内。特别是英伟达的反击能力极强，如果英伟达成功将CPU与GPU彻底绑定，例如GB200架构，那么CPU需求大涨的最终受益者可能依然是英伟达，而非传统CPU厂商。如果这种集成架构成为主流，传统的独立CPU厂商确实会面临压力，因为CPU的功能被GPU巨头顺手做掉了。

CPU价值重估的挑战与不确定性

当然，这条演进路径并非没有挑战。NVIDIA是否会坐视CPU分走预算值得思考，目前NVIDIA正在通过Grace CPU强化自家的CPU能力，或者通过CUDA库将原本属于CPU的逻辑调度任务进一步硬化到GPU侧。如果GPU厂商实现了更高效的异步调度，CPU的增量需求可能会被抵消，这个变量需要持续观察。

CPU价值重估是否只存在于数据中心是另一个值得思考的问题。在手机、PC等端侧NPU正在崛起，NPU可能会承接部分原本属于CPU的管理工作，这可能会削弱CPU在端侧Agent中的地位，端侧的架构演进路径可能与数据中心完全不同。

1:1的配比在商业上是否可持续需要打个问号。CPU核心数的激增意味着能耗和硬件成本大幅上升。如果企业为了控制成本，通过优化算法比如更小的模型、更简单的Agent链条来减少CPU的调用，那么1:1的配比可能只是一个理论峰值而非长期常态，成本约束始终是技术落地的重要考量。

任何技术架构的演进都无法绕开能效比这个核心命题。CPU核心数的翻倍增长必然带来功耗的同步上升，而数据中心的电力供给和散热能力始终存在物理上限。这意味着单纯追求1:1的配比值可能并非最优解，行业更可能在性能与功耗之间寻找一个动态平衡点。未来的计算架构可能呈现更加多元化的态势，不同场景下CPU、GPU、NPU甚至专用加速器的组合会有所不同，不存在一刀切的最优配比。算法层面的优化也会持续进行，更高效的调度算法、更简洁的Agent链路设计都可能降低对CPU硬件的依赖。

CPU价值重估的结论与国产机遇

因为AI Agent的运作本质上是逻辑链条的不断闭合与纠偏，而CPU的架构天然适合处理这种非线性的复杂逻辑，所以随着Agent复杂度的提升，CPU在算力架构中的占比必然会迎来回归。这种从算到想的重心偏移，决定了CPU厂商在2026年后将获得与GPU同等重要的战略地位。

2023-2024年训练爆发阶段最大受益者是NVIDIA GPU，CPU厂商处于边缘角色

2025-2026年推理普及阶段最大受益者是NVIDIA加云厂商，CPU厂商是配角

2026年及以后Agent爆发阶段，最大受益者是GPU加CPU，CPU厂商迎来重估机会

国产CPU的重估机会有着更深层的产业逻辑。Agent时代的核心特征是本地化数据处理和垂直领域深度适配，这恰恰击中了国产CPU的核心优势。在金融、政务、能源等关键行业，数据主权和安全合规是不可逾越的红线，国产CPU在处理本地化数据和垂直领域逻辑调度上，相比于通用架构有更强的主权确定性。龙芯、飞腾、海光、鲲鹏等国产厂商经过多年技术积累，在指令集自主可控、生态适配、行业定制化方面已经建立了坚实的护城河。当Agent成为企业级应用的主流形态，对数据本地化处理的需求将大幅提升，国产CPU凭借安全合规的先天优势，有望在政企市场获得远超通用市场的渗透率。这种垂直领域的结构性机会，是国产CPU在Agent时代独有的增长引擎。

但同时也需要清醒认识到，Agent时代异构计算的驱动适配，包括Driver与CUDA替代方案，依然是国产CPU的核心痛点，如果生态无法对齐，硬件冗余可能无法转化为实际效能。

核心逻辑在于Agent每多一个功能CPU就多一份工作，Agent越复杂CPU负载越重，CPU与GPU在算力架构中逐步走向协同平衡。受益方包括英特尔和AMD等CPU龙头，中国国产CPU包括龙芯、飞腾、海光、鲲鹏，以及需要重新设计CPU配比更高机型的服务器厂商。

Agent爆发促使CPU厂商迎来价值重估，但这种重估并非建立在削弱GPU的基础之上，而是在AI总负载扩张的背景下，修复CPU长期以来被低估的职能权重。这种重估并非线性的，而是伴随着技术路线的博弈、成本约束的挑战和架构多元化的演变。

在关注CPU配比上升的同时，也需要留意上述变量可能带来的预期差。

参考文献

[1]Intel Corporation. Intel Reports First-Quarter 2026 Financial Results [EB/OL]. 2026-04-24.

[2]Morgan Stanley Research. Data Center CPU Market Forecast: The Agentic AI Inflection [R]. 2026-04-19.

[3]Meta Platforms, Inc. Meta Signs Multi-Year Agreement with AWS for Graviton5 CPU Procurement [EB/OL]. 2026-04.

[4]Wang X, Li Y, et al. Towards Understanding, Analyzing, and Optimizing Agentic AI Execution: A CPU-Centric Perspective [J]. arXiv preprint arXiv:2511.00739v3, 2025.

[5]TrendForce. AI Server CPU-GPU Ratio Evolution: From Training to Agentic AI [R]. 2026-04.

[6]Deloitte. AI Compute Workload Forecast 2026: Inference Dominance [R]. 2026.

[7]SemiWiki. Branch Prediction Latency in Agent Systems: CPU vs GPU [EB/OL]. 2026.

[8]Intel Corporation. Data Center CPU White Paper: Orchestration and Scheduling in Inference Scenarios [R]. 2026.

作者：坦桑尼亚老云 | 编辑：栗加

每个视角都是拼凑世界真相的碎片，听真诚的行业观察者讲述独特的故事。我们有深耕行业的资深顾问，连续跨界探索的未来创业者，专注细节的产品匠人，和许多志同道合的你们，如果你有想要分享的故事或者感想，可以留言或者邮件联系（AiysJY@outlook.com），也欢迎点分享给需要的朋友们，记得点一下在看和星标，期待共同在这个行业的宏大叙事中，留下一句诗。：）