一家还没大规模出货芯片的公司,正在试图改写 AI 算力的性价比公式。
近日,由哈佛大学辍学生创立的 AI 芯片公司 Etched 拿到了近 5 亿美元的新一轮融资。这家初创公司估值据称达 50 亿美元,总融资接近 10 亿美元。
该轮融资由 Stripes 领投,Peter Thiel、Positive Sum 和 Ribbit Capital 也参与了投资。此前的支持者还包括 Primary Venture Partners,以及前 GitHub 的 CEO 托马斯·多姆克(Thomas Dohmke)和前 Coinbase 高管巴拉吉·斯里尼瓦桑(Balaji Srinivasan)等知名天使投资人。
有意思的是,这家公司既不做通用 GPU,也不是要完全取代英伟达。而是想把一件事做到极致:让 Transformer 跑得更便宜。
从 GPU 市场来看,英伟达占主导地位。据市场预测,到 2026 年底,英伟达数据中心累计销售额将超过 5,000 亿美元。 Etched 对市场的判断是:过去几年,计算密度(TFLOPS/mm²)仅提升了约 15%。新一代 GPU(NVIDIA B200、AMD MI300X、Intel Gaudi 3、AWS Trainium2 等)现在将两个芯片视为一张卡,使性能“翻倍”。
现在,随着大模型训练放缓和推理暴涨,模型对推理时间的计算和搜索能力利用率严重不足,算力的需求已经不再只拼 FLOPS,而是成本、延迟和能耗的综合比拼。借助更优秀的算法和更快的硬件,有望改善这一局面。
Etched 打造的是为 Transformer 架构的 AI 模型设计的专用定制芯片(ASIC)。Etched称,这款名为 Sohu 的芯片是“史上速度最快的 AI 芯片”。在特定测试配置下,Sohu 在运行 Llama 70B 模型时,可实现每秒处理超过 50 万个 token 的吞吐量,能够构建仅靠 GPU 无法实现的产品。
“在运行文本、图像和视频 Transformer 时,Sohu 的速度比英伟达 Blackwell GB200 GPU 快 1 个数量级,价格也更低。”Etched 公司联合创始人兼 CEO 加文·乌贝蒂(Gavin Uberti)在接受媒体采访时表示,“在 Etched 给定的特定推理配置下,一台由 8 颗 Sohu 芯片组成的服务器可以替代 160 块 H100 GPU。对于需要专用芯片的企业来说,Sohu 将是一个更经济、更高效、更环保的选择。”
尽管这对英伟达技术是一种挑战,但该公司的目标并不是全面取代英伟达,而是“绕过”后者的技术路线。与通用型 GPU 不同的是, Sohu 采取了一种高度专业化的策略:旨在降低能耗的同时,比通用 GPU 更高效地运行 Transformer 模型。
如今,AI 模型的训练成本超过 10 亿美元,而其推理应用规模可能会超过 100 亿美元。在如此庞大的规模下,1% 的性能提升足以支撑一个耗资 5,000 万至 1 亿美元的定制芯片项目。
据 Etched 官网,这款芯片用于生产级推理,在密集模型、稀疏模态、扩散等场景下,每美元(以及瓦)的计算效率都提高 1 个数量级。如果成功,这意味着在推动规模之外,也能够推动 AI 硬件的发展。
公开资料显示,Sohu 采用台积电 4nm 工艺制造,并从上游供应商取得 HBM 内存和服务器硬件供应,来支持芯片与服务器集成的生产能力。
实际上,很多初创公司和科技巨头都在开发专门运行 AI 模型的芯片,即推理芯片。例如,Meta 的 MTIA,亚马逊的 Graviton 和 Inferentia 等。
但 Etched 芯片的独特之处在于“做减法”:它仅专注于运行 Transformer 模型,而无法运行包括 CNN、LSTM、SSM 在内的其他 AI 模型。也正因为这样,它可以避免与此无关的硬件组件以及其他类型工作负载的芯片所带来的软件开销。
此外,Etched 还与 Decart 公司合作推出了 AI 生成游戏 Oasis,可以将其理解为非官方的《我的世界》,游戏画面在玩家交互过程中由生成模型实时合成,而非传统的预制资产渲染。Etched 称,这款模型在 Sohu 上的运行速度提升了 10 倍以上。
(来源:Etched)
2022 年,加文·乌贝蒂(Gavin Uberti)和 Chris Zhu 从哈佛大学辍学,创立了 Etched,公司总部位于美国加州圣何塞。之后,联合创始人兼总裁罗伯特·瓦亨(Robert Wachen)和 CFO 马克·罗斯(Mark Ross)也加入了他们。
公司联合创始人兼 CEO 加文·乌贝蒂(Gavin Uberti)曾在哈佛大学担任数学研究员兼人工智能编译器专家,为 Apache TVM 编写了 Cortex-M 后端。联合创始人 Chris Zhu 曾担任哈佛数学与高性能计算研究员、蒂尔学者(Thiel Fellow),发表过组合数学领域的相关研究。
二人是哈佛大学校友,他们分别攻读数学和计算机科学课程。2022 年年底,他们在进行研究时,意识到在运行生成式 AI 模型时,每美元的性能可以达到传统图形处理器的 140 倍。正是看到了窗口期极短的工程机会,他们决定利用这一发现做更大的事情——从哈佛退学成立公司。
联合创始人兼总裁罗伯特·瓦亨(Robert Wachen)曾担任创业孵化器 Prod 的联合创始人,旗下孵化企业估值超过 500 亿美元。CTO 马克·罗斯(Mark Ross)曾任 Cypress 公司 CTO(该公司以 90 亿美元被收购)。
加文·乌贝蒂和 Chris Zhu 此前在接受媒体采访时曾表示,虽然现在只生产能够运行生成文本的人工智能语言模型的芯片,但整个公司不应该仅仅依赖于单一产品。公司有很多新技术,包括图像和视频生成以及蛋白质折叠模拟等。Etched 更长远的愿景是,为不同类型的 AI 模型制造其他芯片。
目前,也有相关公司展示了与 Etched 类似的思路。例如,AI 芯片初创公司 Perceive 展示了一款具备 Transformer 硬件加速功能的处理器 Ergo 2,可在对参数超过 1 亿的 Transformer 模型进行边缘推理、以更高帧速率处理视频,以及同时推理多个大型神经网络。
智能芯片公司 Groq 的 LPU(Language Processing Unit)是专为推理场景量身定制的 AI ASIC,目标是高效率、低延迟地运行大模型(Transformer 推理)。
此外,AI 芯片公司 Tenstorrent 基于 RISC-V 架构开发高度可扩展的 AI 处理器(如 Grayskull/Wormhole/Blackhole),也在积极寻找 AI 推理或训练中 GPU 之外的替代方案。
尽管前景美好,但也需要看到的是,Etched 的成功是押注在 Transformer 模型继续扮演主流架构的角色。未来如果这个假设发生变化,那所有一切可能要再次来过。可以说,Etched 赌的不是一颗芯片,而是一种时代判断:AI 的未来,或许并不需要那么多“全能”,而只要“刚刚好”就足够了。
参考资料:
https://x.com/Etched/status/1805625693113663834
https://techfundingnews.com/nvidia-rival-ai-chip-maker-etched-founded-by-harvard-dropouts-lands-500m-at-5b-valuation/
https://www.canopy.space/members/member-profile-etched/
https://www.embedded.com/ai-chip-features-hardware-support-for-transformer-models/
https://techcrunch.com/2024/06/25/etched-is-building-an-ai-chip-that-only-runs-transformer-models/
https://siliconangle.com/2024/06/25/transformer-model-chipmaker-etched-ai-raises-120m-challenge-nvidias-market-dominance/
https://www.cnbc.com/2024/06/25/etched-raises-120-million-to-build-chip-to-take-on-nvidia-in-ai.html
运营/排版:何晨龙
热门跟贴