当所有人盯着英伟达的GPU时,高通CEO却在财报会上扔出一条被忽略的消息:他们已经在数据中心造了一颗"专为代理体验设计的CPU"。不是训练卡,不是推理卡,是一颗CPU。这听起来像逆势而行,但背后藏着AI基础设施正在发生的结构性迁移。
从手机芯片到数据中心:高通的秘密布局
高通进入超大规模定制芯片市场的方式相当低调。CEO Cristiano Amon在Q2财报电话会上确认,公司将为"一家领先的超大规模云厂商"提供定制产品,预计"12月季度"开始出货,且正在考虑"多代合作"。
被追问细节时,Amon透露高通已在开发数据中心CPU和高性能AI推理加速器。获得定制ASIC(专用集成电路)能力的途径是收购Alphawave。
更关键的是这句:"我们打造了一颗专为代理体验的数据中心CPU。"
Amon对AI基础设施的演进有一套清晰判断:第一阶段是GPU训练,第二阶段是专用推理硬件,现在进入第三阶段——需要"生成token需求"来驱动代理AI(agentic AI)。
「我认为当你考虑代理时,CPU变得非常重要。」Amon说。这就是高通造这颗芯片的逻辑起点。
什么是"代理AI",为什么它要烧CPU?
要理解这颗芯片的针对性,得先拆解"代理AI"与传统AI应用的区别。
当前主流的大模型交互是"你问一句,我答一句"。但代理AI的目标是:理解用户意图,自主规划步骤,调用工具链,跨应用完成任务。比如不是简单回答"帮我订机票",而是自动查日程、比价、填表、支付、发确认邮件。
这个范式转换对计算架构的冲击是:token生成量会爆炸式增长。
训练阶段,GPU吞吐海量数据;推理阶段,专用加速器优化单次响应速度。但代理场景下,模型需要持续运行、多轮决策、频繁调用外部工具——这些环节的控制流密集、逻辑分支复杂,恰恰是CPU的传统强项。
Amon的判断是:当AI从"回答问题"进化到"执行任务",计算负载的分布会发生迁移。GPU和专用加速器不会消失,但CPU在编排、调度、工具调用中的权重会显著上升。
高通押注的,就是这个迁移窗口。
"代理手机":中国厂商已经跑在前面
数据中心CPU只是故事的一半。Amon同时预告了"代理手机"(agentic smartphones)的到来,并点名了两家中国厂商的产品作为例证。
第一个是中兴通讯的手机,内置字节跳动开发的豆包个人助手。第二个是小米的"miclaw"——一个与操作系统内核深度集成的AI助手,能"洞察用户意图并驱动第三方工具实现"。
这些产品的共同特征:AI不再停留在应用层,而是下沉到系统层,获得调用硬件和跨应用操作的权限。
Amon观察到,"智能手机与AI公司之间正在形成有趣的关联",这种动态"正在改变设计的本质"。
具体表现为两个技术趋势:手机需要"能力更强的CPU",以及可能需要更多内存——而内存目前供应紧张。Amon提到"我们看到新的内存厂商进来建设产能",但2027年的供需情况仍需观察。
内存短缺已经在影响高通。Amon坦言,智能手机厂商(尤其是中国公司)正因内存供应问题决定减少出货量。他和CFO Akash Palkhiwala都预测,需求将在Q3触底,随后反弹。
三星依赖加深:从50%到70%的份额跃升
在高端手机芯片市场,高通与三星的关系正在发生微妙变化。
Amon透露,高通预计今年和明年将拿下三星SoC(系统级芯片)业务的70%,远高于通常的50%水平。背景是三星正在努力改进自研的Exynos芯片,并试图提高其采用比例。
但数据说明,韩国巨头"尚未准备好独立行走"。
这对高通的短期营收是利好,但也隐含风险:三星的Exynos迭代一旦突破,高通的份额可能快速回落。这种依赖关系迫使高通必须在性能窗口期内建立更深的技术护城河。
"代理手机"所需的系统级AI能力,可能就是这条护城河的方向。
财报数字背后的战略焦虑
Q2季度,高通营收106亿美元,同比下降3%。但净利润飙升162%,达到73.7亿美元——成本控制和专利授权的财务贡献明显。
手机业务的增长瓶颈是真实的。Amon将在6月的投资者日上重点阐述多元化战略,强调汽车业务已经带来"更多收入来源和增长路径"。Q2汽车业务营收超过50亿美元(电话会议记录在此处中断)。
数据中心CPU和"代理专用"芯片的披露,需要放在这个背景下理解:高通需要向资本市场证明,手机之外有可信的第二曲线。
但这条曲线的形状仍不清晰。定制ASIC业务的服务对象是谁?多代合作的商业条款如何?"代理CPU"的技术规格和性能基准是什么?6月的投资者日可能会释放更多信息,也可能继续吊胃口。
行业启示:AI基础设施的"控制层"争夺战
高通这颗芯片的真正意义,不在于它能否挑战英伟达,而在于它揭示了一个被低估的战场:AI系统的控制平面。
当前市场叙事聚焦于算力密度——谁有更多的GPU集群,谁的训练规模更大。但随着代理AI从演示走向产品,系统的复杂性会指数级上升:多模型协作、工具链编排、安全沙箱、实时反馈循环。这些环节的优化空间,不在矩阵运算的吞吐,而在控制流的效率。
高通选择从CPU切入,本质是押注"控制层"会成为新的瓶颈。这个判断是否正确,取决于代理AI的普及速度。如果用户仍然满足于聊天机器人,这颗芯片就是过度设计;如果代理工作流成为主流,高通可能抢占了一个关键生态位。
更值得观察的是"代理手机"与数据中心芯片的协同。Amon描述的图景中,端侧负责意图理解和轻量决策,云端负责复杂规划和工具调用——这种端云协同的架构,需要芯片层面的深度配合。高通同时布局两端,是在为垂直整合铺路。
中国厂商的角色也很关键。中兴、小米的探索证明,代理AI的产品化不需要等待硅谷。这种"应用创新倒逼基础设施"的路径,与移动互联网时代如出一辙。高通作为连接两端的芯片供应商,位置相当微妙:既要服务中国客户的激进迭代,又要维护与美国云厂商的长期关系。
6月的投资者日,Amon需要回答的核心问题是:高通的"代理芯片"战略,是防御性的多元化尝试,还是进攻性的生态位抢占?从财报会的措辞看,他自己可能也在寻找答案。
热门跟贴