第四大Token工厂冲刺IPO！毛利率-24%，AI Infra被卷成"流量生意"

硅基观察Pro

2026-07-01 22:31 ·北京 ·优质互联网领域创作者

又一家AI公司要在港股上市了。

昨天，港交所官网显示，硅基流动正式披露招股书，冲刺港股“AI Token工厂第一股”。

作为AI基础设施公司，硅基流动身上几乎浓缩了这一轮AI浪潮最火热的一面。

2024年12月，硅基流动平台上的平均日均token消耗只有478亿。而到了今年4月，公有云平均日均token消耗增长到5785亿，翻了10倍还不止。

从收入来看，硅基流动的增长很快。2024年，公司收入只有 734.6 万元，2025年已经增长到了5533 万元，同比增长 653.2%。

但热闹的数据背后，也藏着AI推理市场最残酷的一面。

去年，硅基流动亏了1.87亿，几乎是收入三倍还多，毛利率只有-24%。

除了研发费用外，亏损主要来自公有云和用户补贴。2025年，占公司过半收入的公有云业务，毛利率只有-119%。也就是说，每产生一块钱的收入，公司还要亏1块钱。

同时，为了抢用户，去年硅基流动就投入了5421万元免费算力，相当于几乎把全年收入又补贴了一遍。

即便如此，今年前四个月，这个数字只有145万，相当于只有去年全年的四分之一。按比例来说，不仅没有增长，还出现了下降。

一家原本靠效率取胜的AI基础设施公司，在国内竞争激烈环境下，似乎也终究免不了被卷入到流量和价格漩涡里。

国内第四大Token工厂

硅基流动的创始人袁进辉曾用一个极其通俗的比喻，来形容他们的业务：

"算力就像白菜、土豆等原材料，既可以直接卖给客户，也可以将这些原材料加工成宫保鸡丁之类的成品菜，再'端'给客户。我们提供的是成品模型，而不是原始的算力资源。"

在这个被称为「Token工厂」的模式中，硅基流动的核心能力是，通过「管道」，将复杂的算力资源和多元模型打包，统一输出成便宜、好用的标准化Token。

这种模式的价值，主要体现在两个方面：

第一，是提升算力利用效率，尤其是国产芯片的适配能力。

中国AI Infra最大的特点，是底层算力非常分散。美国市场几乎围绕英伟达CUDA生态展开，而国内除了英伟达，还有华为昇腾、沐曦、摩尔线程、壁仞等大量国产AI芯片。不同芯片的软件栈并不统一，一家企业如果想同时使用多种芯片，往往需要投入大量研发成本做适配。

这就是硅基流动试图解决的问题，解决各类国产芯片（如昇腾、摩尔线程、沐曦等）的适配问题，通过高性能推理引擎让国产芯片能产出更多Token。

目前，硅基流动已经能够在大规模生产环境下，同时支持英伟达GPU以及昇腾、摩尔线程、沐曦等多种国产AI芯片。

第二点是模型中立。

今天的大模型市场，大多数云厂商既提供基础设施，又拥有自己的模型和AI应用，既是平台，也是参与者。

而硅基流动只做基础设施，既不研发模型，也不做AI应用。这种纯粹的中立性，对于担心数据安全、业务依赖或被平台绑定的头部客户（尤其是金融、政务、大型企业）来说，有很大的吸引力。

截至目前，硅基流动已经服务了超过1.3万家企业客户，平台累计支持超过170个模型。

按2025年Token年吞吐量计算，硅基流动已是中国第四大Token供应平台，排在它前面的，是火山引擎、阿里云和百度智能云这三座大山。

对于一家成立仅三年的AI Infra公司来说，这样的成绩绝对算不上差。

卖Token，成了流量生意

相比Token的快速增长，硅基流动的商业化表现就比较尴尬了。

从收入来看，硅基流动的增长很快。2024年，公司收入只有 734.6 万元，2025年已经增长到了5533 万元，同比增长653.2%。

不过与大模型公司类似，硅基流动也亏了不少。2025年，公司的经调整亏损为1.87亿，几乎是收入三倍还多。

除了研发费用外，亏损主要来自公有云和用户补贴。

从交付方式来说，硅基流动主要分别两种：公有云和本地部署，收入基本各占一半。其中，公有云又分为无服务器词元服务、专属实例，前者是共享算力资源，后者相当于独家算力资源。

不过公有云毛利率很低。2025年，公有云的毛利率只有-119%。也就是说，每产生一块钱的收入，公司还要亏1块钱。

与此同时，为了吸引更多用户进去公有云平台。去年，硅基流动还花了5421万的算力推广成本。这些钱，全用来给用户发免费算力了。

硅基流动这么做的原因也很简单，用很低的价格把更多用户吸引进来，然后让他们去购买更多的独家算力。

理想很美好，不过现实很骨感。

去年全年，使用公有云共享算力资源的用户为545万。而今年前四个月，这个数字只有145万，相当于只有去年全年的四分之一。按比例来说，不仅没有增长，还出现了下降。

一个很重要的原因是，注册用户增长放缓。2025年，公有云注册用户为919.7万。而截至今年4月3日，这个数字为1028万，增长11.78%。

虽然公有云共享算力的付费用户渗透率从去年年底的13.13%增长到44.18%。但截至今年前4月，购买独家算力的客户仍然只有20个，而去年全年是49个。

公有云的商业化窘境背后，一个更残酷的真相是：公有云API正在不可逆地变成“流量批发”，最终只能靠极端的规模效应来微利生存。

更可怕的是，连运营商都下场抢食了。

今年5月中旬，中国移动、中国联通、中国电信相继面向C端用户推出Token套餐。上海移动联合腾讯推出“1元可购40万Tokens”；北京移动甚至推出了最低5.99元的次包。

当算力Token被运营商打包成普通用户能买的“流量包”时，硅基流动这种的中间商，又还能有多少空间？

越来越卷的AI Infra

公有云竞争激烈，但本地化部署也没好到哪去。过去两年，虽然本地部署的平均客单价从22万元提升至130.3万元，但客户数量却从28家减少到20家。

按理说，本地部署对AI Infra能力要求更高，硅基流动的效率优势应该更容易转化为商业价值。但问题在于，几乎所有玩家都盯上了这块市场。

回过头来看，在行业早期，硅基流动的效率优势确实非常明显。

由于更早押注开源生态，它成为DeepSeek爆发最大的受益者。在很长一段时间里，它几乎是唯一支持DeepSeek的第三方MaaS平台。

而当所有人都看到了AI推理算力和异构算力infra需求，这个市场也正在变得越来越卷。尤其当效率成为整个中国AI产业的共识时，硅基流动的优势也在被产业各方快速追赶。

一方面，无论是阿里、腾讯、百度、字节等大厂，还是摩尔、沐曦、壁仞等芯片公司，都在疯狂补齐Infra算力技术和模型适配能力。

去年年底，腾讯云甚至专门拆分成立AI Infra部门。而字节跳动的AI Infra团队规模，据业内估计已经超过千人。

另一方面，模型厂商和芯片厂商之间，也开始绕过第三方Infra平台，直接合作。比如，华为昇腾与DeepSeek、摩尔线程与智谱、壁仞与阶跃等合作，都在缩短模型到芯片之间的距离。

换句话说，原本属于AI Infra公司的工作，正在被上下游逐步消化。

壁仞科技创始人张文去年也谈过这一点。他认为，国产GPU从设计到量产往往需要两年，而模型几乎每周都在迭代，因此模型公司与芯片公司的协同只会越来越紧密。

当然，这并不意味着独立AI Infra没有机会。毕竟，中国的AI基础设施不是一个统一的英伟达世界，同时开源生态的发展，也在不断提升MaaS平台的价值。

真正的问题在于，这个市场的空间能有多大。

过去，云计算和SaaS的发展已经证明，中国to B生意从来不是一个可以靠技术或者效率取胜的事情。从这一点来说，硅基流动的故事并不好讲。

文/阿奇

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴