从管道到平台：Google Cloud Next 2026上的数据战略|bigquery|cloud|上下文|元数据|客户端节点|数据战略|知名企业|移动|谷歌

过去十年的数据基础设施围绕管道（Pipeline）构建。移动数据、转换数据、存储数据，然后对它做些有用的事情。这种方法变得如此普遍，以至于大多数团队已经接受它。

在Cloud Next 2026大会上，Google似乎在倾向于一种不同的数据处理方式——一种围绕直接访问、统一平台和AI驱动执行的方式。未来的愿景不是更好的管道，而是更少的管道。

大多数数据系统依赖一系列定时任务和转换。每个步骤都依赖前一步骤正确执行。随着系统增长，这些依赖关系增加，使管道更难管理、运行成本更高。数据被提取、转换、存储，然后用于分析或下游系统。这种方法仍然有效并被广泛使用，但随着时间推移，它创造了层层ETL、ELT和编排，在规模扩大时增加了复杂性。

这正是Google开始着手设计解决的问题。

在今年的大会上，BigQuery呈现在同一个地方数据进行AI和处理运行。这不仅关乎数据最终落在哪里，更关乎模型在哪里与实时数据集交互。这消除了通常位于中间的系统间来回传递。它也改变了转换工作的发生位置。更多工作可以留在BigQuery内部，而不是将数据推送到其他工具再取回来。

据Google表示，这意味着更少的传输、更少的定时任务、更少的管道逻辑需要维护。管道当然仍然存在，但不是在原始数据和实际使用之间的每一步都需要它们。

Lakehouse公告指向类似方向——数据在不同工具需要时不应每次都要移动。在大会上，Google引入了围绕Apache Iceberg构建的跨云数据湖屋（lakehouse），支持BigQuery和Spark等服务。目标是让多个系统在同一数据上工作，而无需每次创建新副本。Google预计这将减少大多数管道存在所支持的持续复制。