ASIC要逆袭GPU,现在筹码堆到了哪一步?这件事还没完,但框架已经清晰了。

打开网易新闻 查看精彩图片

目前全球AI产业正经历一个明确的拐点:算力需求的主引擎,从训练大模型转向了推理应用。IDC预测,到2027年,推理将占全球智能算力需求的70%以上。这个转变直接改变了芯片市场的游戏规则,而ASIC(专用集成电路)正是新规则下最大的受益者。

机构预测,2026年ASIC出货量约770万片,占AI加速器市场45%,2027年将反超GPU,达到58%。

这场爆发由三个核心引擎驱动:推理需求的刚性拉动、云厂商自研能力的成熟、以及产业链产能的规模化就绪。但这三个引擎的转速并不同步,未来的走向,取决于几个关键变量。

为什么推理场景,突然就“用不上”GPU了?

在训练阶段,通用GPU凭借其灵活性无可替代。但到了推理阶段,考核指标变成了单位Token能耗、端到端延迟和总拥有成本(TCO)。传统GPU架构存在“内存墙”问题,超过60%的能耗浪费在数据传输上,实际算力利用率不足50%。

这就像用一辆全能的越野车跑城市快递,虽然能跑,但成本高得离谱。

ASIC则是为特定路线定制的快递车。谷歌TPU v5在矩阵运算上的性能是同功耗GPU的3到5倍;Meta的MTIA芯片每瓦性能比通用GPU提升7倍。规模化部署后,ASIC能把推理集群的TCO降低40%以上,电力成本降低60%以上。

博通CEO更是直接指出,OpenAI的最新ASIC样片,单位算力成本比英伟达Blackwell系列GPU降低了约50%。

判断: 推理需求爆发是确定性趋势,但ASIC对GPU的替代程度,取决于后续模型架构的演变。如果未来出现需要频繁切换的新模型架构,GPU的灵活性仍会保有优势。

科技巨头的“独立宣言”,能落地多少?

GPU供给长期紧张,且成本高昂,是云厂商自研ASIC最直接的动力。目前,谷歌、亚马逊、Meta、微软和OpenAI全部入局,且技术路线已跑通。谷歌TPU已100%支撑内部搜索和Gemini大模型的负载,并向外部客户开放。

摩根士丹利预测,光是谷歌,2027年TPU系列总出货量就超过776万颗。

走向A:如果这些出货规划按时落地, 2027年ASIC全面接过推理侧算力供给的主力角色是大概率事件。触发信号:持续跟踪台积电CoWoS产能分配数据,如果谷歌、亚马逊的封装订单在2027年上半年保持稳定增长,则走向A基本确认。

走向B:如果部分厂商的芯片量产延迟, 则ASIC的份额增长可能放缓。主要风险点在于OpenAI的Jalapeño芯片,它计划2027年才开始放量,2028年才能全速生产。触发信号:关注2027年一季度OpenAI对外披露的部署规模,若低于预期,说明其路线图正在调整。

我的判断: 走向A的概率更高。头部厂商的ASIC项目已迭代多年,谷歌TPU就是典型例子,其产业链成熟度远非OpenAI这种新玩家可比。综合来看,2027年ASIC出货量超过GPU的预测,有坚实的产能规划支撑。

产业链的“锅”,配得上ASIC的“米”吗?

ASIC要爆发,除了需求和设计,还得看能不能造出来。好消息是,核心瓶颈——先进封装正在被突破。台积电2026年底CoWoS月产能将提升至12-14万片,较2025年接近翻倍。英特尔也加入战局,其EMIB-T封装良率已突破90%,并获得了谷歌、亚马逊等客户的预付产能定金。

但风险同样存在。最大的短期制约是ABF载板,2027年供给缺口预计将扩大至21%。此外,磷化铟光芯片产能紧张,也会拖慢集成度更高的CPO(共封装光学)类ASIC在2027年大规模落地。

判断: 产业链已经跨过了“能不能造”的小批量门槛,进入了“能造多少”的百万片级交付爆发期。但“造多少”存在天花板,载板等结构性短缺可能导致部分厂商的出货达不到最乐观的预期。

给你的追踪框架

这件事的结局还未定,但你可以通过观察几个具体信号,在接下来几个月里自己判断ASIC趋势的快慢:

  • 看产能:持续关注台积电、英特尔对其先进封装产能利用率的表述。如果下半年出现产能利用率下滑的迹象,说明需求端或资金投入不及预期。
  • 看成本:关注云厂商(谷歌、微软、亚马逊)的财报,如果其云业务毛利率出现显著提升,将是自研ASIC开始产生实际效益的有力证明。
  • 看新玩家:OpenAI的Jalapeño从设计到流片仅用了9个月,开发成本下降了60%以上。如果更多中小型公司能复刻这种速度,ASIC的渗透率将远超预期。

当前,ASIC的爆发已经是“进行时”,但能在2027年以多快的速度反超GPU,仍然取决于上述供需两端的博弈。我的判断是,超预期比低于预期的可能性更大,因为决定性的供需错配和成本优势,已经清晰到足以让所有巨头全力押注。