又一家AI公司要在港股上市了。
昨天,港交所官网显示,硅基流动正式披露招股书,冲刺港股“AI Token工厂第一股”。
作为AI基础设施公司,硅基流动身上几乎浓缩了这一轮AI浪潮最火热的一面。
2024年12月,硅基流动平台上的平均日均token消耗只有478亿。而到了今年4月,公有云平均日均token消耗增长到5785亿,翻了10倍还不止。
从收入来看,硅基流动的增长很快。2024年,公司收入只有 734.6 万元,2025年已经增长到了5533 万元,同比增长 653.2%。
但热闹的数据背后,也藏着AI推理市场最残酷的一面。
去年,硅基流动亏了1.87亿,几乎是收入三倍还多,毛利率只有-24%。
除了研发费用外,亏损主要来自公有云和用户补贴。2025年,占公司过半收入的公有云业务,毛利率只有-119%。也就是说,每产生一块钱的收入,公司还要亏1块钱。
同时,为了抢用户,去年硅基流动就投入了5421万元免费算力,相当于几乎把全年收入又补贴了一遍。
即便如此,今年前四个月,这个数字只有145万,相当于只有去年全年的四分之一。按比例来说,不仅没有增长,还出现了下降。
一家原本靠效率取胜的AI基础设施公司,在国内竞争激烈环境下,似乎也终究免不了被卷入到流量和价格漩涡里。
国内第四大Token工厂
硅基流动的创始人袁进辉曾用一个极其通俗的比喻,来形容他们的业务:
"算力就像白菜、土豆等原材料,既可以直接卖给客户,也可以将这些原材料加工成宫保鸡丁之类的成品菜,再'端'给客户。我们提供的是成品模型,而不是原始的算力资源。"
在这个被称为「Token工厂」的模式中,硅基流动的核心能力是,通过「管道」,将复杂的算力资源和多元模型打包,统一输出成便宜、好用的标准化Token。
这种模式的价值,主要体现在两个方面:
第一,是提升算力利用效率,尤其是国产芯片的适配能力。
中国AI Infra最大的特点,是底层算力非常分散。美国市场几乎围绕英伟达CUDA生态展开,而国内除了英伟达,还有华为昇腾、沐曦、摩尔线程、壁仞等大量国产AI芯片。不同芯片的软件栈并不统一,一家企业如果想同时使用多种芯片,往往需要投入大量研发成本做适配。
这就是硅基流动试图解决的问题,解决各类国产芯片(如昇腾、摩尔线程、沐曦等)的适配问题,通过高性能推理引擎让国产芯片能产出更多Token。
目前,硅基流动已经能够在大规模生产环境下,同时支持英伟达GPU以及昇腾、摩尔线程、沐曦等多种国产AI芯片。
第二点是模型中立。
今天的大模型市场,大多数云厂商既提供基础设施,又拥有自己的模型和AI应用,既是平台,也是参与者。
而硅基流动只做基础设施,既不研发模型,也不做AI应用。这种纯粹的中立性,对于担心数据安全、业务依赖或被平台绑定的头部客户(尤其是金融、政务、大型企业)来说,有很大的吸引力。
截至目前,硅基流动已经服务了超过1.3万家企业客户,平台累计支持超过170个模型。
按2025年Token年吞吐量计算,硅基流动已是中国第四大Token供应平台,排在它前面的,是火山引擎、阿里云和百度智能云这三座大山。
对于一家成立仅三年的AI Infra公司来说,这样的成绩绝对算不上差。
卖Token,成了流量生意
相比Token的快速增长,硅基流动的商业化表现就比较尴尬了。
从收入来看,硅基流动的增长很快。2024年,公司收入只有 734.6 万元,2025年已经增长到了5533 万元,同比增长653.2%。
不过与大模型公司类似,硅基流动也亏了不少。2025年,公司的经调整亏损为1.87亿,几乎是收入三倍还多。
除了研发费用外,亏损主要来自公有云和用户补贴。
从交付方式来说,硅基流动主要分别两种:公有云和本地部署,收入基本各占一半。其中,公有云又分为无服务器词元服务、专属实例,前者是共享算力资源,后者相当于独家算力资源。
不过公有云毛利率很低。2025年,公有云的毛利率只有-119%。也就是说,每产生一块钱的收入,公司还要亏1块钱。
与此同时,为了吸引更多用户进去公有云平台。去年,硅基流动还花了5421万的算力推广成本。这些钱,全用来给用户发免费算力了。
硅基流动这么做的原因也很简单,用很低的价格把更多用户吸引进来,然后让他们去购买更多的独家算力。
理想很美好,不过现实很骨感。
去年全年,使用公有云共享算力资源的用户为545万。而今年前四个月,这个数字只有145万,相当于只有去年全年的四分之一。按比例来说,不仅没有增长,还出现了下降。
一个很重要的原因是,注册用户增长放缓。2025年,公有云注册用户为919.7万。而截至今年4月3日,这个数字为1028万,增长11.78%。
虽然公有云共享算力的付费用户渗透率从去年年底的13.13%增长到44.18%。但截至今年前4月,购买独家算力的客户仍然只有20个,而去年全年是49个。
公有云的商业化窘境背后,一个更残酷的真相是:公有云API正在不可逆地变成“流量批发”,最终只能靠极端的规模效应来微利生存。
更可怕的是,连运营商都下场抢食了。
今年5月中旬,中国移动、中国联通、中国电信相继面向C端用户推出Token套餐。上海移动联合腾讯推出“1元可购40万Tokens”;北京移动甚至推出了最低5.99元的次包。
当算力Token被运营商打包成普通用户能买的“流量包”时,硅基流动这种的中间商,又还能有多少空间?
越来越卷的AI Infra
公有云竞争激烈,但本地化部署也没好到哪去。过去两年,虽然本地部署的平均客单价从22万元提升至130.3万元,但客户数量却从28家减少到20家。
按理说,本地部署对AI Infra能力要求更高,硅基流动的效率优势应该更容易转化为商业价值。但问题在于,几乎所有玩家都盯上了这块市场。
回过头来看,在行业早期,硅基流动的效率优势确实非常明显。
由于更早押注开源生态,它成为DeepSeek爆发最大的受益者。在很长一段时间里,它几乎是唯一支持DeepSeek的第三方MaaS平台。
而当所有人都看到了AI推理算力和异构算力infra需求,这个市场也正在变得越来越卷。尤其当效率成为整个中国AI产业的共识时,硅基流动的优势也在被产业各方快速追赶。
一方面,无论是阿里、腾讯、百度、字节等大厂,还是摩尔、沐曦、壁仞等芯片公司,都在疯狂补齐Infra算力技术和模型适配能力。
去年年底,腾讯云甚至专门拆分成立AI Infra部门。而字节跳动的AI Infra团队规模,据业内估计已经超过千人。
另一方面,模型厂商和芯片厂商之间,也开始绕过第三方Infra平台,直接合作。比如,华为昇腾与DeepSeek、摩尔线程与智谱、壁仞与阶跃等合作,都在缩短模型到芯片之间的距离。
换句话说,原本属于AI Infra公司的工作,正在被上下游逐步消化。
壁仞科技创始人张文去年也谈过这一点。他认为,国产GPU从设计到量产往往需要两年,而模型几乎每周都在迭代,因此模型公司与芯片公司的协同只会越来越紧密。
当然,这并不意味着独立AI Infra没有机会。毕竟,中国的AI基础设施不是一个统一的英伟达世界,同时开源生态的发展,也在不断提升MaaS平台的价值。
真正的问题在于,这个市场的空间能有多大。
过去,云计算和SaaS的发展已经证明,中国to B生意从来不是一个可以靠技术或者效率取胜的事情。从这一点来说,硅基流动的故事并不好讲。
文/阿奇
热门跟贴