「企业AI卡壳不是因为模型不行,是数据没准备好给AI用。」SAP首席技术官Philipp Herzig这句话,道破了这笔双收购的真正意图。
SAP刚宣布同时拿下Dremio和Prior Labs。一家做数据存储管理,一家做表格分析模型。两家加起来,SAP没透露具体花了多少钱——只说了后者未来四年会再投11.7亿美元。这数字本身就很说明问题。
一图看懂:SAP在买什么
这笔交易的核心是一张技术拼图。Dremio在左,这家德国创企在右,中间是SAP的Business Data Cloud(商业数据云)。
Dremio的核心资产是Apache Iceberg和Apache Polaris两个开源项目。Iceberg是一种专门存超大表格的数据格式,能改表结构、拆分数据块、版本回滚。Polaris管的是Iceberg表格的元数据——谁创建的、改了多少次、谁能看。
这家柏林团队的杀手锏是TabPFN-2.5模型,专门吃表格数据。一次能处理10万行,还能蒸馏出轻量版给具体项目用。
SAP的打法很清晰:Dremio解决「数据怎么存、怎么管」,这家被收购的AI实验室解决「数据怎么算、怎么分析」。两头一夹,中间的商业数据云就成了统一入口。
为什么偏偏是表格?
表格数据(tabular data)听起来很土,但企业世界里它占绝对主流。库存表、财务报表、销售记录——全是行和列。大语言模型(大语言模型,即LLM)能写诗能编程,碰到十万行财务明细照样抓瞎。
Dremio的解法是给表格加一层AI代理(AI代理,即AI Agent)。用户用自然语言问问题,系统自动转SQL查询。不用学代码,不用等IT排期。那家德国公司更激进:直接训了一个只认表格的模型,TabPFN-2.5。
这个模型的设计很有意思。它不做通用智能,就死磕表格预测——分类、回归、异常检测。该团队说它能自动扫库存表找错误条目,这对制造业和零售业的诱惑力可想而知。
「蒸馏引擎」是另一个隐藏卖点。大模型变小模型,按项目定制,跑起来更快更省硬件。企业落地AI,成本账算得过来。
开源底座的战略价值
SAP收购Dremio,明面上买的是产品,实际上买的是Iceberg生态的入场券。
Iceberg正在成为大数据领域的事实标准。Snowflake、AWS、Google Cloud都在支持它。SAP之前没有自己的Iceberg原生能力,现在通过Dremio补上了。
Polaris同样关键。元数据管理是数据治理的命门,谁掌握元数据层,谁就能定义访问规则和安全策略。SAP把Polaris收进来,等于在多云环境里有了统一的数据控制权。
Herzig说的「数据没准备好」,翻译过来就是:企业数据分散在几十上百个系统里,格式各异,权限混乱。AI代理再聪明,找不到数据、读不懂权限,也是白搭。Dremio+Polaris要解决的就是这个基础设施层的问题。
独立运营玄机:11.7亿买的是什么
该柏林团队会继续独立运作,这在SAP的收购案里并不常见。11.7亿美元分四年投,说明SAP看中的是长期研究产出,而不是快速产品化。
TabPFN系列出自柏林工业大学的研究团队,学术血统浓厚。保持独立性,能留住核心研究员,也能继续发论文、参加学术会议——这对顶尖AI人才很重要。
SAP的算盘是:该实验室做前沿突破,SAP负责工程化和商业化。商业数据云、S/4HANA、SuccessFactors这些产品线,都能接TabPFN的能力。
一个细节:这家创企之前只融了930万美元。SAP这笔投资相当于把团队估值直接抬了两个数量级。柏林AI圈估计要热闹一阵子。
商业数据云的野心
把两家技术揉进Business Data Cloud,SAP想打造的是一个「数据即服务」的中台。
逻辑是这样的:企业把各处数据接进来,Iceberg统一存储,Polaris统一管理元数据,该团队的模型负责智能分析,Dremio的AI代理降低使用门槛。最终用户用自然语言就能跨系统查数、分析、预测。
这和Snowflake、Databricks的路线直接撞车。后两家也在
热门跟贴