打开网易新闻 查看精彩图片

不是问题的问题。


作者|桦林舞王

编辑|靖宇

当地时间 6 月 2 日,Perplexity 在 Computex 2026 的 Intel 主题演讲上,做了一个很多人没太在意、但可能改变整个 AI 应用行业走向的演示。

不是新模型,不是更快的搜索,而是一套「任务路由」系统。

简单来说,就是 AI 自己决定哪些事在你的电脑上做,哪些事扔给云端——而不是让用户去选。

CEO Aravind Srinivas 和 Intel CEO Lip-Bu Tan 站在台上,在一台跑着 Intel Core Ultra Series 3 芯片的设备上演示了全程。本地模型负责判断,云端模型负责执行复杂任务,两者之间的调度对用户完全透明。

这件事听起来像是一个工程细节,但背后藏着一个更大的问题:AI 应用的架构之战,已经从「谁的模型更强」,悄悄转向了「谁能把资源调度得更聪明」

01

本地 VS 云端

过去两年,AI 行业走了一条很直接的路:算力不够?加算力。模型不够大?加参数。隐私有顾虑?那就……先搁置。

但企业用户不会永远搁置隐私问题。

一个典型的场景是:你让 AI 助手帮你整理会议记录,里面可能有未公开的财务数据、客户信息、合同条款。这些东西传到云端,法务部门就会来敲门。但如果只用本地模型处理,算力撑不住,效果又打折扣。

打开网易新闻 查看精彩图片

Perplexity 在跑任务时关注到了数据隐私问题|图片来源:Perplexity

这就是 Perplexity 混合推理(Hybrid Agentic Inference)试图解开的死结。

它的核心逻辑不复杂——让本地模型先做「侦察员」,判断每一个子任务的敏感程度和复杂度,然后决定是留在本地处理,还是打包发给云端的前沿模型。用户不需要做任何选择,系统自动完成路由。

据技术分析,任务分类发生在 API 层。「这是 5 个 token 的问答,还是 500 个 token 的代码生成请求?」——本地模型用 4 位量化处理前者,内存占用减少约 75%;云端模型接管后者,但在传输前会做确定性哈希处理,防止原始数据泄漏。

理论上,边缘设备的往返延迟可以因此降低 60%

当然,「理论上」这三个字很重要。

02

从「AI 搜索」到任务路由

如果只看今天的演示,容易误以为这是 Perplexity 的一次突然发力。但把时间线拉长,会发现这家公司在过去半年里做的每一步,都在为这个方向铺路。

今年 3 月,Perplexity 与 CoreWeave 达成战略合作,用专属的 NVIDIA GB200 NVL72 集群跑推理工作负载,把云端算力基础设施夯实。5 月中旬,它推出了 Mac 应用,把 Personal Computer 功能开放给 Pro 和 Enterprise 用户——之前只有 Max 用户才能用。这一步很关键,相当于在正式推出混合推理之前,先把用户教育做了一遍,让大家习惯「AI 在本地跑」这件事。

Perplexity 任务路由的演示视频|图片来源:Perlexity

到今天的 Computex 演示,混合推理功能还没有正式上线,官方说会在 7 月推出。但选在这个时间点、这个舞台亮相,用意很清楚——英特尔需要一个真实的 AI PC 用例,Perplexity 需要一个比自家官网更大的曝光窗口,双方一拍即合。

与此同时,Perplexity 的商业版图也在加速扩张。从 18 亿美元估值融资 1 亿美元,到两个月后以 200 亿美元估值完成 2 亿美元融资,自成立三年来累计融资已达 15 亿美元。钱还在持续进来,说明投资人押注的不只是搜索,而是整个 AI 代理基础设施的叙事。

03

聪明的不是模型,是调度器

VentureBeat 的分析抓到了这件事的本质。它指出,Perplexity 这套系统的关键主张,不是「本地可以跑模型」——这件事已经有几十种工具能做到了。真正的差异化在于,Perplexity 的系统自己做路由决策,逐个任务,不需要用户提前配置

这是一个视角的根本转变。

以前,「本地 vs 云端」是一个用户层面的选择题。你要么信任云端,要么忍受本地模型的能力上限。Perplexity 想把这道选择题从用户面前拿走,变成系统内部的一个工程问题。

但这恰恰是挑战最大的地方。

要让编排器在生产环境中可靠运行,它需要同时做对几件事:准确评估每个子任务的复杂程度,理解涉及数据的敏感级别,了解用户本地硬件的实时性能状态,还要管理跨设备-云端的任务状态同步。任何一个环节判断失误,轻则输出质量下降,重则把不该上云的数据送出去了。

MacRumors 社区里有用户的担忧更直接——「这是让 AI 出现幻觉然后删文件的好办法。」这话听起来像段子,但触到了一个真实的焦虑:当 AI 代理获得了更多系统权限,并且还要自主做路由决策的时候,「可解释性」和「可审计性」变得比任何时候都更重要。

打开网易新闻 查看精彩图片

Perplexity 任务完成提示页面|图片来源:Perplexity

企业安全专家也提出了另一层风险——如果云端模型的调用链没有经过 SOC 2 等级的验证,混合架构本身可能反而引入新的供应链安全漏洞。隐私问题还没解决,安全问题已经跟上来了。

值得一提的是,Perplexity 还在另一个战场上承受压力。

截至今年 5 月底,已有包括 CNN、纽约时报、News Corp 在内的九家媒体机构对其提起有效诉讼,指控版权和商标侵权。这是一个悬在头顶、迟迟没有定论的法律风险。混合推理是产品层的创新,但版权纠纷是商业模式层的隐患,两者并行,并不互相抵消。

一家公司可以在技术架构上做出令人印象深刻的判断,同时在商业合规上依然面临真实的挑战。这两件事不矛盾,但放在一起,会让「Perplexity 的未来」这个命题变得更复杂一些。

说白了,混合推理是 Perplexity 押注的方向,但押注能不能兑现,取决于执行层面的每一个细节,以及它能否在法律压力下保持足够的专注度。

AI 应用正在经历一次安静的架构革命。不是哪个模型又刷新了 benchmark,而是「算力在哪里跑、数据往哪里走」这个底层问题,开始被认真对待。

Perplexity 今天在 Computex 台上演示的那几分钟,可能比任何一次模型发布都更值得被记住——因为它在讲的,是 AI 应用该怎么被构建,而不只是 AI 能做什么。

至于 7 月上线之后,这套系统在真实用户手里能交出什么成绩单,那才是这个故事真正开始的地方。

*头图来源:Perplexity

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

具身智能融资热度持续爆表,一个月估值涨 10 倍、大牛出来就是几十亿天使、三轮融资同时开……这波热潮理性吗?国内外路线有何差异?技术真实进展到哪了?

今晚 20:00,极客公园视频号直播间,我们请来了蓝驰创投合伙人曹巍、具身智能投资人笔盒、诺亦腾机器人 创始人/首席执行官戴若犁,和极客公园副主编郑玄、作者 Li Yuan,一起聊聊这个行业的真相与泡沫。