作者 | 铅笔道 松格
编辑 | 铅笔道 黄小贵
最近,AI芯片公司Etched宣布:成立至今累计拿到8亿美元融资,最新一轮单笔5亿美元,投后估值冲到50亿美元(约合人民币340亿)。
Etched专门做的AI推理芯片,它只做这一件事,因此希望比英伟达GPU更快、更省电、更便宜。
Etched芯片还没大规模交货,已经签下超10亿美元(约合人民币68亿元)的客户采购合同。
2023年,Etched估值3400万美元,到今天暴增约147倍。
三个哈佛辍学生的豪赌
Etched的故事,要从2022年三个哈佛退学的年轻人说起。
创始人Gavin Uberti、Robert Wachen与华裔联合创始人Chris Zhu还在读书时就发现:市面上所有AI大模型,几乎全靠英伟达GPU来跑。厉害是厉害,很多时候“用牛刀杀鸡”,不划算。
很多AI企业吐槽,营收一半以上要拿来交算力费,赚的钱全给英伟达打工了。
三位创始人反其道而行:只做专门跑Transformer大模型的芯片,放弃所有多余功能。
Etched创始人 Gavin Uberti 来源:Etched官网
但几乎所有硅谷VC都拒绝投资:万一未来大模型不用Transformer架构了,你们公司直接归零,风险太大。
连续碰壁之后,他们索性选择“隐身模式”——不对外宣传、不接受媒体采访,闷头埋头研发三年。
他们挖来了英伟达、谷歌TPU、博通的资深工程师,团队短短三年扩张到400多人,还在中国台湾搭建产线、加州自建实验室,全程把控芯片设计、流片、整机系统全流程。
Etched在台积电4nm工艺上一次就做出了能正常工作的成品芯片——业内叫“A0一次成功”,直接省下上亿研发成本。
更有意思的是他们的投资人阵容,堪称AI界“全明星天团”:深度学习诺奖得主辛顿、“AI教母”李飞飞、前特斯拉AI主管卡帕西、硅谷教父彼得·蒂尔全都下场投资;量化交易巨头Jane Street单笔砸超1亿美元,台积电旗下产业基金也战略入股,顶级对冲基金集体扎堆入局。
资本愿意重金押注,核心是看懂了他们的商业模式:别人只卖芯片,Etched直接打包整套机柜、互联硬件、配套软件,给客户交付一整套“AI推理集群”。客户不用自己搭配、调试设备,买回去就能直接跑大模型,从根源上解决了企业算力搭建难的痛点。
10亿订单背后
Etched融资历程与估值增长
资本愿意砸钱,本质是看准了AI推理赛道巨大的缺口——市场急需能替代GPU、低成本高效率的硬件。
这笔5亿美元融资,主要用于扩产、完善供应链、扩充研发团队,支撑后续大额订单交付。
Etched Sohu芯片 来源:Etched官网
Etched这款Sohu专用芯片搭载超大内存,专门适配Llama、通义千问、DeepSeek等市面上主流大模型。
根据官方内部测试数据(尚未经第三方独立验证),同等8颗芯片组成的服务器,跑700亿参数大模型,每秒能输出50万文字;而英伟达H100同规格服务器,每秒只能输出2万多文字,吞吐量差距20倍。
大模型推理性能对比(Llama 70B) 来源:公开资料整理
效率提升的同时,电费成本大幅下降。普通GPU跑大模型,硬件利用率常年只有30%左右,大量算力白白浪费;Etched专用芯片利用率能突破90%。
Etched能快速拿到订单和融资,背后是推理市场全面爆发。
2025年全球AI推理市场规模约1037亿美元,预计2026年增长到1178亿美元,到2034年突破3126亿美元,年复合增长率接近13%。更乐观的数据则认为,2034年推理市场规模将膨胀到4915亿美元。
全球AI推理市场规模预测
推理是AI企业最大的成本痛点,OpenAI在2024年的推理成本就高达数十亿美元,Anthropic的Claude模型每次长对话,后端推理成本动辄数美元。而Etched称,专用芯片能把单条问答的算力成本砍半。
Etched融资,也透露出另一个值得关注的变化:推理产业链正在形成。
第一类机会,是推理芯片。
除了Etched,Groq、Cerebras等公司都在争夺这一市场。它们销售的不只是芯片,而是整套服务器、软件和集群解决方案。Etched此次披露,客户预订的也是整套"Frontier Inference Cluster",而不是单独购买芯片。
第二类机会,是推理云服务。
越来越多企业不会自己买服务器,而是按调用次数购买推理能力。
像Baseten、Fireworks AI、Together AI、GroqCloud等平台,本质上都是"AI推理云"。
企业上传模型,就能快速提供API服务,不需要自己管理GPU。
第三类机会,是推理软件。
GPU利用率一直不高。
大量创业公司开始研究编译器、调度软件、KV Cache优化、模型压缩、量化推理等技术。
模型不用重新训练,只要软件优化,就能提升推理效率,直接降低客户成本。
第四类机会,是数据中心。
推理时代和训练时代最大的不同,是推理更加分散。
训练集中在少数超级数据中心。
推理则可能发生在云端、企业、本地服务器,甚至未来的汽车、机器人和手机。
因此,推理数据中心、边缘计算、液冷、电源、网络设备都会迎来新的需求。
一次危险的押注
Etched想要兑现市场预期,还有三个绕不开的现实难题。
第一,芯片还没真正交到客户手里,一切性能宣称都停留在纸面。
Spheron在2026年4月的分析报告中明确指出:Sohu芯片“尚未公开可供购买或租赁”,其成本数据无法计算,真实性能差距可能远没有20倍那么夸张。
第二,技术路线押注单一,高度依赖Transformer架构。
Sohu芯片只能跑纯Transformer模型。但行业趋势正在发生变化:DeepSeek V4是671B参数的MoE架构,Qwen3-235B-A22B同样是MoE模型,代表了开源大模型的前沿方向。
扩散语言模型作为新兴类别,计算模式与Transformer完全不同,Sohu同样无法适配。如果未来行业主流从Dense Transformer转向MoE或全新架构,这款专用芯片的竞争力将快速下滑。
这是所有专用芯片公司共同的命门——赌对了风口起飞,赌错了满盘皆输。
第三,巨头和同行都在加速,先发优势的窗口正在收窄。
英伟达已经推出针对性推理GPU,性能飙涨35倍,预计2026至2027年出货量达400万至500万颗。
更现实的威胁来自供应链:台积电4nm产能、HBM3E内存供货、整机组装,任何一环延期都会导致订单无法按时交付。Etched10亿美元的合同是信心票,但只有顺利量产交付,才能真正变成营收。
芯片行业有个残酷规律——“流片成功”只是万里长征第一步,从实验室到客户机房,中间隔着量产良率、散热稳定性、软件兼容性等无数道坎。
本文不构任何成投资建议。
欢|迎|联|系
想获得调研,请联系:qianbidao01
想加入社群,请联系:qianbidao01
想市场合作,请联系:qianbidao01
文章转载,请联系:qianbidao01
热门跟贴