八年前Meta就有万亿参数模型,但今天的AI系统依然需要从外部世界获取新鲜、准确、经过精心筛选的知识。搜索是AI接入这些知识的主要途径,也是任何需要得出结论、付诸行动并完成现实世界工作的产品所依赖的基础组件。

Perplexity的搜索堆栈每秒处理数千次查询。2025年9月,这家公司首次公开了其搜索系统的架构概览。持续运转的系统创新,支撑着搜索应用程序接口、智能体应用程序接口和Computer等一系列新产品的发布。

打开网易新闻 查看精彩图片

然而,传统搜索架构正在智能体时代暴露出致命短板。在过去,AI系统将搜索视为一个黑箱整体:模型发出查询指令,搜索引擎跑完预设管道,模型再把返回结果当作上下文来消费。当用户需求还比较简单时,没人在意这条管道是怎么设计的,也没人关心它对当前任务是否最优。默认选项看起来够用,默认接口也似乎够用。

今天的情况已经完全不同。用户不再满足于让AI做一次性分析,他们期待智能体能花上几小时甚至几天时间,端到端地完成一个任务。这些任务可能极其复杂、高度开放,信息需求千变万化。单一架构正在被这种压力压弯。

打开网易新闻 查看精彩图片

Perplexity的内部观察显示,单次任务在几分钟内就能触发数百甚至上千次检索操作。对人类来说无法实现的工作流,对智能体而言却是家常便饭。真正的瓶颈出在控制权上:前沿模型推理固定上下文的能力已经相当出色,但最强AI系统需要的是更底层的操控能力——将搜索的积木块拆解成软件开发工具包,让智能体能像写代码一样编排检索策略。

这就是Perplexity给出的答案:搜索即代码。搜索不再是一个单体服务,而是一组可编程的原语。智能体不是被动地拿到搜索结果,而是主动生成代码来组合这些原子化的检索原语。传统架构向外暴露的是单套固定系统,模型串行调用;而新架构暴露的是可编程的检索积木,由智能体通过生成的代码来编排。搜索本身,开始变得像智能体一样自主。