打开网易新闻 查看精彩图片

6月30日,AI推理芯片创业公司Etched周二正式“走出隐身模式”,宣布其首款芯片已在台积电(TSMC)N4P制程上实现首次流片成功,并已进入客户验证阶段。公司称,围绕这款芯片打造的完整推理系统已获得超过10亿美元的已签署客户合同,目前正在加速量产,以满足市场需求。

Etched成立于2022年,总部位于美国加州圣何塞,定位为英伟达AI芯片的重要挑战者。与只销售单颗芯片不同,Etched主打一整套面向前沿大模型的frontier inference clusters(前沿推理集群)。该系统包括自研AI芯片、定制机架、互联、软件和配套基础设施,目标是让前沿模型在推理环节运行得更快、成本更低、能效更高。公司表示,其系统目前已可运行DeepSeek、Qwen、Mamba、Llama等模型,并设计为支持各种形态、任意大参数规模的模型。

随着AI加速嵌入各行各业,推理正成为AI公司规模化服务客户时最大的瓶颈和成本中心。Etched的核心判断是,除非推理基础设施在速度、成本和供给上实现数量级改善,否则前沿AI难以充分释放经济和社会价值。

公司同时披露,成立不到三年,已通过多轮此前未公开融资累计募集8亿美元。最近一轮融资为去年12月完成的5亿美元融资,投后估值达到50亿美元。投资方阵容包括VentureTech Alliance的战略投资,以及Peter Thiel、Jane Street、Hudson River Trading、Jump Trading、Two Sigma、Stripes、Ribbit Capital、Radical Ventures、Primary VC、Positive Sum等机构和投资人。AI领域重量级人物也参与其中,包括Andrej Karpathy、Geoffrey Hinton、李飞飞、Stanley Druckenmiller、Arthur Mensch、Scott Wu等。公司称,此轮融资也体现了其与全球领先半导体制造商之间更深层的代工合作关系。

Etched正在围绕机架级系统推进规模化生产。公司已在中国台湾地区设立工厂,并在圣何塞总部建设了数据中心、测试中心和NPI原型实验室,将设计、验证和生产环节整合在同一体系之下。公司表示,其目标是在2027年迈向吉瓦级规模。

近日,Positive Sum CEO、播客Invest Like the Best主播与Etched两位创始人Gavin Uberti和Robert (Rob) Wachen进行了一番对话。Positive Sum也是Etched的投资人之一。

访谈内容基本可以总结为以下几点:

  1. Etched认为,AI推理将成为比训练更持续、更庞大的市场。

  2. 公司不只做芯片,而是打造面向前沿模型的完整推理集群。

  3. 现有GPU等芯片架构并不是为新一代大模型推理专门设计的。

  4. 推理的核心瓶颈在于Prefill阶段的算力和Decode阶段的数据移动。

  5. Etched通过低电压设计提升有效算力,并降低功耗与发热。

  6. 公司通过自研互联和集群级内存架构提升Decode效率。

  7. Etched更关注整机架token产能,而不是单颗芯片的峰值参数。

  8. 公司采取高度垂直整合路线,覆盖芯片、机架、软件、测试和生产。

  9. Rob认为“生产就是产品”,量产和部署能力本身就是核心壁垒。

  10. Etched通过极快执行和并行开发,在芯片回片前完成大量系统准备。

  11. 公司团队超过400人,成员主要来自NVIDIA、Broadcom、Google TPU等顶级硬件团队。

  12. Etched早期融资十分困难,2023年几乎被主流投资机构集体拒绝。

  13. 随着推理瓶颈凸显,资本市场已转向追逐AI推理基础设施。

  14. 公司已累计融资8亿美元、估值50亿美元,并获得超10亿美元客户合同。

  15. 未来AI基础设施竞争的核心,可能是低成本、高效率的token产能。

  16. 长程AI Agent会显著放大推理需求,尤其是对Decode速度和并发能力的需求。

  17. Rob认为,未来GDP增长可能取决于每兆瓦电力能运行多少智能体。

  18. Etched接下来仍需证明其量产能力、客户部署效果和对英伟达生态的竞争力。

Etched联合创始人兼CEO Gavin Uberti表示,公司很早就意识到,前沿AI将成为有史以来最具经济意义的技术之一,但支撑这些模型可持续、经济化运行的基础设施并不存在。联合创始人Rob Wachen 则强调,Etched从一开始就是为吉瓦级规模而建设,“生产就是产品”。在他看来,AI基础设施建设正处于历史上最大规模的投资周期之一,真正重要的公司将是那些能把技术转化为可大规模制造、部署和运营系统的公司。

目前,Etched团队已超过 400人,成员主要来自 NVIDIA、Broadcom、Google TPU、SK Hynix、高频量化交易公司等曾参与构建当代AI推理系统的机构。Stripes创始人兼合伙人Ken Fox 表示,推理将成为AI最关键趋势之一,而Etched之所以特殊,是因为Gavin和Rob不仅招募了来自NVIDIA、Google TPU和Broadcom的顶尖团队,也选择构建完整系统,而不是只做其中一块。公司自Stripes领投B轮以来推进速度超过预期,目前已进入客户硬件验证和性能调试阶段。

Etched早期融资并不顺利。两位创始人在播客中透露,2023年,他们拿着一份30页备忘录向投资人论证AI最终需要专门为推理设计的芯片,而不能只依赖通用GPU,但当时几乎所有主要投资机构都选择拒绝,公司一度只能按月维持运营,接近耗尽现金。

如今,随着推理成为AI产业的关键瓶颈,资本正加速涌向AI芯片和基础设施公司。Cerebras完成备受关注的IPO;Amazon、Google、Microsoft等云巨头均在推进自研AI芯片,OpenAI也宣布与Broadcom合作推出首款定制芯片。

Etched正是在这一轮AI推理基础设施竞赛中快速升温的新玩家。