一家闷头盈利、服务了大半个中国大模型圈的真实数据玩家并入上市公司,第一次走到台前。
据IPO早知道消息,6月5日晚间,千百度(1028.HK)发布公告称,拟通过上海千度收购上海本原智数已发行股本总额约83.33%,总代价为人民币1.5亿元;同时,上海本原智数拟向上海千度发行认购股权,相当于经发行认购股权扩大后已发行股本总额约45.45%,总代价为人民币1.5亿元。
紧随收购事项及认购事项完成后,公司将透过上海千度拥有目标公司已发行股本总额约90.91%。
这意味着,交易完成后,千百度将以3亿对价取得国内领先AI数据服务商本原智数的控股权益,并纳入合并报表,正式形成“鞋履 + 人工智能数据”双主业。
一家鞋履港股上市公司,收购一家AI数据公司,乍看略显“违和”。
但若放进过去几年中国AI产业极速生长的那条暗线里,这桩交易恰恰精准落在了一个正被全球资本重估的赛道上,以及这条赛道中一块长期被低估的硬拼图——当模型与算力日趋同质化,高质量、可验证的数据,正成为通往更高阶智能的关键瓶颈。
对以鞋履零售为主业、近年持续寻找第二增长曲线的千百度而言,这更是一次从“讲故事”到“真转型”的关键落子——市场此前对其AI转型的预期,被这一笔实打实、且已盈利的并购稳稳接住。
一条正在被全球重估的赛道
人工智能的竞争,正在发生一次底层转移。过去十年,胜负主要由算力和模型架构决定;但当公开数据被大模型逐渐消化、当算力与算法日益普及,下一阶段的关键瓶颈已不再是「谁的模型更大」,而是「谁能持续为模型提供新的、更难的、来自真实世界的高质量经验」。
在全球,资本已用真金白银为此投票。2025年6月,Meta以约143亿美元投资数据标注龙头Scale AI,对应估值约290亿美元,一举将「AI数据服务」从过去的「成本项」,重新定义为AI时代的「战略资产」。
逻辑很朴素:算力可以采购,算法可以复现,唯独把人类专家的专业判断、把真实物理世界的交互反馈,规模化且可验证地转化为模型可学习的数据——这件事又难、又慢、难以靠资本速成。它是整条产业链里最难、也最难替代的环节。
业界已将2026年视为具身智能的「数据规模化元年」。当一个赛道开始被全球重新定价,市场终究会回头去寻找那个最扎实、最靠谱的源头供给者。
把「最难的活」做成壁垒
公告称,目标集团(本原智数)为国内领先的人工智能数据服务供应商,亦是国内少数同时具备大模型、世界模型及具身智能完整数据服务能力的供应商之一,处于人工智能产业链上游,核心业务在于将人类的专业与认知经验,转化为人工智能模型可供训练及验证的高质量数据。
回望十一年前,整个行业的注意力几乎都压在算力和模型架构上。而本原智数赌的是另一件事:当算力终将充裕、架构终将收敛,真正决定模型上限的,是数据——不是数据的多少,而是数据的难度、质量与可验证性。
这个判断在当年并不性感。而本原智数偏偏又选了最难走的那条路——不做规模大、门槛低的通用标注,而是扎进价值链里技术门槛最高、最难标准化的高难度、专业级数据服务,专接那些别人不愿做、也做不好的任务:组织数学、代码、法律、医疗等领域的专业人员完成专家级标注,构建衡量模型真实能力的评测数据集,为世界模型重构虚拟环境数据,为具身智能采集真实物理世界的交互数据。
十年下来,本原智数把这条最苦的路,走成了最深的壁垒。如今它服务着国内领先的大模型厂商、一线互联网与内容平台,以及领先的具身智能企业,长期承接他们技术难度最高、要求最严苛的数据任务,并在多个高价值数据品类上成为相关客户的独家供应商。
支撑这一切的,是一张厚重的“交付底盘”:全国十大交付中心、数十万行业专家构成的众包协作网络,以及自研的标注、质检与众包平台、一整套数据安全与合规资质——这正是规模化、高安全地交付高难度数据的核心门槛,也是难以被速成复制的护城河。
更难得的是它的盈利能力。公告显示,2024及2025年,本原智数收入分别约1.465亿元及1.562亿元,税后净利分别为710万元及1,110万元;2026年前五个月,收入增长强劲。
在一级市场动辄“融资数亿、烧钱换增长”的AI创业潮里,一家靠真实订单与经营现金流把规模做起来、还能稳定盈利的数据公司,本身就是极稀缺的标的。
同时站在AI数据爆发的两条主线上
真实世界,才是一切前沿AI数据的源头。
一个常被外界忽略的产业常识是:在具身智能的实际交付中,真实数据在数据采购中的占比高达95%以上;而所有仿真数据,最终都要回到真实世界的数据去校准与验证。因此,当行业越来越聚焦“物理世界的数据为什么这么稀缺”时,做源头真实数据采集与交付的玩家,注定将在未来站稳“基座”的位置。
而本原智数,恰好同时押中了驱动这一轮需求爆发的两条主线:
其一,是模型从“模仿人”走向“自我检验、自我提升”,对高难度、可验证数据的需求激增;其二,是AI走出屏幕、进入物理世界,催生了对真机采集数据的全新需求。
作为数据被用于世界模型训练、并为多家头部「具身大脑」公司提供具身数采的供应商,本原智数是国内少数同时站在这两条主线上的玩家。这意味着,无论未来需求向哪一侧倾斜,它都站在受益的一端。
「违和」之处,恰是护城河
这桩交易最先要过的,是“违和感”这一关。一家AI公司并入一家鞋企,关键或许不在“经营”,而在“结构”。
根据公告,收购完成后,本原智数将继续保持独立品牌与独立运营,并实施数据隔离;千百度则以鞋履主业产生的稳定现金流,为其提供资金与上市平台支撑。这意味着,本原智数无须再靠一轮轮融资续命,能够心无旁骛地做长期、难而正确的事。
更微妙的,是中立性这一层。数据公司最怕“站队”——一旦被某家模型大厂控股,竞争对手往往出于顾虑而转投他处。这样的故事,在行业里并不少见。
而这桩并购的“违和感”,在这里恰恰翻转成了优势。由于千百度本身不做AI模型、不与本原智数的任何客户构成竞争,互为对手的“巨头”们,便仍能放心地把数据交给同一家供应商。一个“看似无关”的资本母体,反而成了守护中立性的最佳人选。
这也是本原智数创始人在公开信中反复强调的一点:中立不是一种短期策略,而是对所有客户的长期承诺。
水面之下的「源头」,开始浮出
随着通用大模型向多模态、世界模型与具身智能持续演进,数据需求迎来爆发,本原智数有望成为这轮上行浪潮中的持续受益者。
把时间拉长,这桩交易真正的看点,或许不在「跨界」,而在它揭开的一个产业事实——在喧嚣的AI浪潮里,最先被资本与媒体追逐的,往往是离模型最近、最会讲故事的那批公司;而像本原智数这样离数据源头最近、闷头把最苦的活做成壁垒、还把生意做成了正向盈利的玩家,反而长期沉在水面之下。
此次并入上市公司、就此“浮出水面”,给了本原智数一个迟来的“扩音器”。当一个赛道开始被全球重新定价,资本与产业终究会回头去寻找那个最扎实、最靠谱的源头供给者。
而这个位置,本原智数已经坐了十年。
本文为IPO早知道原创
作者|苏打
热门跟贴