当企业高管想查一组数据,平均要等多久?Starburst内部调研给出的数字是:41%的客户把大量时间耗在报表队列里。这不是效率问题,是商业模式的裂缝。
从仪表盘到对话:BI行业的代际切换
2026年4月14日,Starburst Data Inc.正式发布AI Data Assistant(人工智能数据助手),代号Aida。核心定位很明确:让业务人员用自然语言直接查询企业数据,跳过传统商业智能(Business Intelligence,商业智能)的仪表盘和报表流程。
CEO Justin Borgman在发布直播中直接放话:「AI是新的BI,我认为这将是分析行业未来的方向——你能直接通过AI回答问题。」
这不是功能升级,是产品哲学的转向。传统BI的工作流需要漫长的抽取-转换-加载(Extract-Transform-Load,数据抽取转换加载)流程,Borgman点破了痛点:「企业正在进入实时时代,问题变化的速度比仪表盘建造的速度更快,领导者需要的是答案,不是工单队列。」
Starburst的判断是:生成式人工智能(Generative AI,生成式人工智能)与结构化企业数据的结合,将是企业AI的下一个主战场。Borgman的逻辑很直接:「AI的效果取决于它能访问和理解的数据。大多数组织没有AI问题,他们有的是数据问题。」
技术架构:不动数据,动计算
Aida的关键设计在于分布式执行。它不强制把数据迁移到统一仓库,而是就地连接——云存储、数据湖、数据仓库、运营系统,全部通过开源Apache Trino引擎(开源分布式SQL查询引擎)实时查询,治理策略和元数据跨源一致应用。
这个架构选择背后是对企业现实的妥协。大型组织的数据孤岛是历史遗留问题,强制集中化往往意味着数年项目和数千万投入。Starburst的策略是承认碎片化现状,用联邦查询(Federated Query,跨源联合查询)技术绕过它。
AI副总裁、联合创始人Matt Fuller解释了Aida的推理机制:它不只是把自然语言转成查询语句。系统会评估可用数据、构建查询、迭代中间步骤,最终输出「有上下文根基的答案」。
「这远不止聊天,」Fuller说,「它会推理问题的含义,识别能回答问题的数据集,然后交付响应。」
演示环节用了两个场景:一是分析历史F1赛车数据,根据自然语言提示生成查询、可视化和叙事解释;二是处理财务数据,从总账中直接产出摘要、图表和高管级汇总信息。
用户摩擦:被忽视的隐性成本
Fuller提到一个被行业长期低估的指标:用户摩擦。Starburst内部数据显示,41%的客户在报表队列中消耗大量时间。这个数字的残酷之处在于——它衡量的是「等待被服务」而非「获取价值」。
传统BI的隐性成本结构就此暴露:数据团队成为瓶颈,业务人员的问题堆积成工单,决策节奏被技术流程绑架。Aida的赌注是,自然语言交互能把「提需求-等排期-收报表」的链条压缩成「问-答」的即时反馈。
这个逻辑与整个行业的动向共振。从Snowflake到Databricks,从微软Fabric到Google的Looker,所有主流数据平台都在叠加生成式AI层。区别在于切入角度:有的从数据工程侧切入,有的从可视化侧改造,Starburst选择的是查询执行层的智能化。
Borgman的「AI是新的BI」宣言,本质上是把竞争维度从「谁能建更复杂的仪表盘」转向「谁能把数据访问延迟降到接近零」。这不是取代数据分析师,而是重新定义人机分工——机器处理查询构造和初步分析,人类专注判断和决策。
结构化数据的AI红利期
一个反直觉的观察:生成式AI的爆发先席卷了非结构化数据(文本、图像、视频),而结构化数据(表格、数据库、交易记录)的智能化反而滞后。Borgman认为这是机会窗口。
结构化数据是企业运营的「记录系统」(System of Record,核心记录系统),包含客户、交易、库存、财务等关键信息。但这些数据的利用效率长期受限于技术门槛——SQL查询语言、数据仓库架构、ETL流程的专业知识壁垒。
Aida的解题思路是「推理框架」:不是简单的文本到查询翻译,而是多步骤的上下文理解。用户问「上季度华东区销售额为什么下滑」,系统需要识别时间范围、地理维度、指标定义,可能还要关联促销数据或竞品动态,最终构造出有效的分析路径。
这种能力依赖两个基础:一是Starburst在Trino引擎上积累的跨源查询优化经验,二是大语言模型(Large Language Model,大型语言模型)在语义理解和代码生成上的进展。两者结合,才能把「自然语言问题」转化为「分布式数据源的联合分析」。
风险同样明显。自然语言查询的模糊性可能导致错误解读,跨源数据的质量和一致性难以保证,治理策略在AI自动化场景下的有效性尚未充分验证。Starburst的应对是强调「上下文根基」——答案必须可追溯至具体数据源和查询逻辑,而非黑箱输出。
行业格局:数据平台的AI军备竞赛
Starburst的入局让数据平台的竞争更加拥挤。Snowflake 2023年推出Cortex AI,Databricks押注Lakehouse AI和DBRX模型,微软在Fabric中集成Copilot,Google把Gemini嵌入BigQuery。每家都在回答同一个问题:当AI能直接对话数据,传统BI工具的价值锚点在哪里?
Starburst的差异化在于「开放架构+联邦查询」的组合。Trino作为开源引擎,避免了客户对单一云厂商的锁定;跨源查询能力则切中了多云、多系统并存的企业现实。Aida的发布是把这两个技术资产转化为AI时代的用户体验优势。
但生态位争夺才刚开始。传统BI厂商如Tableau、Power BI也在叠加AI功能,初创公司如ThoughtSpot、Tellius更早押注自然语言分析。Starburst的挑战是:能否把技术架构优势转化为足够明显的体验差距,让业务用户愿意迁移工作习惯。
Borgman的底气来自对行业周期的判断。他认为仪表盘和报表是「批量处理时代」的产物,而实时决策需求正在推动分析工具向「流式交互」演进。Aida的命名也暗示了方向——Aida是「AI Data Assistant」的缩写,同时谐音「aida」(日语「相遇」),寓意人与数据的直接对话。
商业模式的连锁反应
如果Aida类产品成为主流,数据团队的组织形态可能被重塑。当前大量人力消耗在需求澄清、报表开发、迭代维护上,AI自动化后,这些职能的价值密度下降,而数据治理、语义层设计、AI交互优化等新职能上升。
对Starburst自身而言,Aida是平台价值的上移。从「查询引擎」到「智能分析助手」,客单价和续约率都有提升空间。更深远的影响在于数据消费场景的扩展——当业务人员能自助获取洞察,数据驱动的决策可能从「月度经营会」下沉到「日常运营对话」。
这也是Borgman强调「结构化数据是AI下一个前沿」的商业逻辑。非结构化数据的AI应用(内容生成、客服机器人等)已经红海化,而结构化数据的智能化还处于早期,企业付费意愿明确,竞争格局未定。
不过,「AI是新的BI」这个命题本身需要验证。自然语言查询的准确率能否达到生产环境要求?业务人员的提问质量是否足以驱动有效分析?数据治理在开放对话场景下如何不失控?这些问题没有现成答案。
Starburst的演示选择了F1数据和财务总账,场景相对结构化、指标定义清晰。更复杂的业务问题——比如「为什么这个季度的客户流失率异常」——涉及因果推断、多变量分析、定性信息整合,当前技术栈能否胜任仍是问号。
开放提问
当41%的用户时间被困在报表队列,问题可能不是仪表盘太慢,而是「提问题」这个动作本身被错误地分配给了组织。Aida的赌注是:让能决策的人直接对话数据,把技术中间层压缩到最小。但这里有个张力——业务人员真的知道该问什么吗?或者说,当答案变得即时可得,提出好问题的能力会不会成为新的稀缺资源?
热门跟贴