编辑 | 泽南
本周三,OpenAI 与博通合作,推出了自己的首款芯片:Jalapeño。
OpenAI CEO 山姆・奥特曼(Sam Altman)与博通 CEO 陈福阳(Tan Hock Eeng)共同展示新芯片的晶圆。
这些芯片将由博通(Broadcom)制造,用于 OpenAI 的人工智能推理负载,其中包括在 ChatGPT、Codex 等应用中驱动 AI 模型。
OpenAI 总裁 Greg Brockman 强调,Jalapeño 创下了极快的九个月流片记录,这很大程度上归功于 OpenAI 内部 AI 模型在整个设计流程中的深度参与。这种用 AI 加速底层硬件研发的速度让 OpenAI 内部团队也感到惊讶。
Jalapeño(意为墨西哥胡椒)是一个专为现代 LLM 推理,从零开始设计的全新方案,并非基于早期 AI 工作负载改造的通用加速器。它参考了 OpenAI 日常运行的系统,加速的任务包括 ChatGPT、Codex、API 以及未来的智能体产品,同时也面向当前及未来业界的 LLM 应用。OpenAI 的目标是将当今领先的 AI 加速器的性能和吞吐量与接近最快专用推理系统的延迟相结合,从而使 Jalapeño 适合大规模交互式 LLM 产品。
该芯片的性能仍未公布,但 OpenAI 称,早期测试表明,Jalapeño 的每瓦性能将显著优于目前最先进的技术。该公司预计将在未来几个月内发布一份详细的性能技术报告。
在 Jalapeño 上,新架构减少了数据传输,并平衡了计算、内存和网络资源,从而使实际利用率更接近理论峰值性能。博通的芯片实现和网络技术,包括 Tomahawk 网络芯片,助力了该平台实现大规模量产,天弘(Celestica)则负责系统集成、主板和机架。
如今 AI 的算力需求越来越大,各家公司对于芯片的需求也日益迫切,Brockman 表示 OpenAI「无法获得足够快的算力」,博通首席执行官陈福阳也支持这一观点,称该公司六家客户的计算需求「简直是永无止境」。
陈福阳表示,「这远远超出了我们能解决的范围……而且这不仅仅是 2026 年或 2027 年的问题,我们在 2028 年也看到了同样甚至更高的需求。」
Jalapeño 是 OpenAI 构建其模型和产品背后「完整技术栈」计划中的重要一步。OpenAI 表示,通过自行设计更多技术栈,其可以更高效地提供更多智能,并不断推动先进 AI 走向更广泛的应用。
自 OpenAI 在 2022 年开启生成式 AI 热潮以来,该公司一直是英伟达 GPU 的最大买家之一。日益昂贵的图形处理器是构建 AI 模型和运行大型工作负载的关键基础设施。但 OpenAI 的需求呈爆炸式增长,因此需要其他专用型芯片提供动力。
今年早些时候,OpenAI 与亚马逊达成了一项协议。其中包括使用其 Trainium 人工智能芯片的网络服务。OpenAI 也与英伟达的竞争对手 AMD 签署了协议,还与 AI 芯片制造商 Cerebras 展开了合作。
经过 18 个月的合作,OpenAI 和博通公开宣布计划将在今年晚些时候开始开发和部署 OpenAI 设计的芯片机架,最终目标是造出总计达到 10 吉瓦能耗规模的算力集群。
Jalapeño 是一款专用集成电路(ASIC),其灵活性不如英伟达的 GPU,但价格也更低,并且可以针对特定的 AI 任务进行定制化设计。
OpenAI 将这款芯片称为「智能处理器」,并将其描述为他们正在构建的平台中的第一个人工智能加速器,旨在使先进的 AI 更快、更可靠,并让更多人更容易获得。
OpenAI 与博通表示,他们的目标是在 2026 年底前初步部署 Jalapeño 芯片,并在未来几年内扩大部署规模。
参考内容:
https://openai.com/index/openai-broadcom-jalapeno-inference-chip/
https://www.cnbc.com/2026/06/24/openai-and-broadcom-reveal-jalapeno-first-ai-chip-in-partnership.html
热门跟贴