想象你是一家欧洲搜索引擎的CEO。你的算法每天处理数百万次查询,却始终摸不透用户真正想要什么——因为那个"用户点击后是否满意"的关键反馈,被锁在谷歌的服务器里。现在,欧盟说这把锁必须打开。

一场酝酿三年的数据拆墙行动

打开网易新闻 查看精彩图片

2026年4月15日,欧盟委员会正式出手。依据《数字市场法》第6条第11款,他们要求谷歌向竞争对手开放四类核心数据:排名数据、查询数据、点击数据、浏览数据。覆盖范围是过去24小时内欧洲用户的搜索活动。

这不是罚款威胁,是结构性拆解。谷歌必须通过应用程序接口(API)实时交付这些数据,接收方包括传统搜索引擎,以及内置搜索功能的智能聊天机器人。

时间线拉回到2023年9月。当时谷歌被正式认定为"守门人"平台,DMA全部义务于2024年3月生效。但真正的 enforcement(执法执行)直到本周才落地——委员会花了两年多时间,把"数据共享"这一抽象条款转化为可操作的六维框架。

这六个维度分别是:谁有资格获取数据、共享数据的范围边界、传输频率与技术手段、匿名化标准、基于公平合理无歧视原则(FRAND)的定价机制,以及数据访问的治理流程。每个维度都对应着未来几个月的博弈焦点。

AI搜索为什么需要谷歌的"废料"?

传统搜索的竞争逻辑很清晰:抓取网页、建立索引、排序返回。但AI搜索彻底改写了游戏规则。当用户向聊天机器人提问时,系统需要判断:这个答案靠谱吗?用户满意吗?要不要换个来源?

这些判断依赖的正是谷歌积累二十年的行为反馈闭环——用户搜了什么、点了哪个结果、停留多久、是否二次搜索。欧盟委员会在文件中明确将"具有集成搜索功能的AI聊天机器人"列为合格数据接收方,直接瞄准了搜索市场的下一个主战场。

一位参与DMA起草的官员曾私下表示,2023年立法时没人预料到AI搜索会爆发得如此迅猛。但委员会的正式文本显示,他们已将这一变量纳入考量:智能聊天机器人与谷歌自有AI产品形成直接竞争关系,因此必须获得同等的数据燃料。

这里存在一个微妙的产品设计困境。谷歌的搜索质量优势并非来自某个单一算法,而是用户行为数据的实时回流。每秒钟数百万次的点击、滑动、返回操作,构成了一个自我强化的系统。欧盟试图切断的,正是这种"数据-体验-更多数据"的飞轮效应。

匿名化的技术攻防战

委员会的方案包含四层防护:数据分箱(将敏感字段泛化处理)、低频查询抑制(删除可能识别个人的罕见搜索词)、接收方的合同约束(禁止二次使用),以及传输前移除直接个人标识符。他们反复强调:不是要谷歌交出个人搜索历史,只是匿名化的聚合行为信号。

但隐私倡导者的质疑同样尖锐。即使单条记录去标识化,特定搜索词组合、地理位置元数据、行为模式的交叉分析,仍可能重新定位到具体个人。这种"指纹化"风险在学术研究中已有充分论证。

国家安全层面的担忧则指向另一个方向:聚合后的欧洲公民搜索行为数据,是否会流入外国所有或审查不足的第三方平台?这个问题在公开咨询阶段预计将成为焦点。

值得注意的是,委员会对"匿名化"的定义尚未最终锁定。5月1日咨询截止后,技术标准的细节可能在7月27日最终裁决前发生显著调整。谷歌的合规团队正在评估:多大的数据粒度既能满足监管要求,又能最大限度保护核心竞争优势。

FRAND定价:谁来为数据买单?

方案中"公平、合理、无歧视"的定价原则,直接借用了电信行业的标准必要专利(SEP)许可框架。但搜索数据与专利池有着本质差异:后者的价值相对可量化,前者则高度依赖使用方的算法能力和产品形态。

一个关键悬而未决:谷歌能否对高频API调用设置阶梯价格?能否要求接收方证明自己的技术处理能力?委员会文件仅提出原则,具体费率结构留待后续谈判。这很可能引发新一轮反垄断争议——如果定价被认为构成事实上的准入壁垒,欧盟自己可能面临司法挑战。

对于欧洲的AI搜索初创公司,这笔账需要仔细计算。实时数据流的获取成本,加上合规审计、技术对接的投入,是否真的能缩短与谷歌的体验差距?还是仅仅制造了一种"数据平等"的幻觉?

7月27日的倒计时与平行战场

本次程序独立于欧盟委员会更广泛的DMA执法权力,但两者并行推进。谷歌自2024年3月起已承担全部守门人义务,包括搜索结果中自我优待的限制、广告透明度的提升等。数据共享要求是新增的专项措施,针对的是搜索市场的结构性壁垒。

公开咨询窗口仅剩两周。第三方反馈将直接影响最终裁决的技术细节,包括匿名化标准的严格程度、数据更新的实时性要求、以及接收方的资质审查门槛。谷歌的回应策略同样关键——是全面抗争,还是选择性妥协以换取其他领域的宽松?

一个容易被忽略的时间节点:2026年7月27日的最终裁决日,恰好距离DMA全面生效约16个月。这个周期反映了欧盟反垄断执法的现实节奏——从规则制定到技术落地,远比立法辩论更为漫长。

对于AI搜索行业的参与者,这16个月的窗口期充满变数。如果数据共享令在第三季度生效,2026年底可能出现首批基于谷歌行为数据训练的第三方搜索模型。但如果匿名化标准过于严格,或者FRAND定价谈判陷入僵局,实际效果将大打折扣。

数据收束

欧盟委员会的提案文本共涉及六类合规要求、四类核心数据、四层匿名化防护,以及一个7月27日的最终裁决 deadline(截止期限)。谷歌在欧洲搜索市场的份额长期维持在90%以上,而DMA守门人认定已覆盖其22项核心平台服务。这场数据拆墙行动的真正测试,不在于规则能否通过,而在于竞争对手拿到数据后,能否在用户体验层面形成实质性替代——毕竟,燃料只是燃料,引擎的制造工艺才是差距所在。