打开网易新闻 查看精彩图片

Meta憋了一年放出Muse Spark,基准测试紧咬Claude Opus 4.6和GPT 5.4。但真正的猛料藏在meta.ai的对话窗口里——没人想到要问那个问题。

「你有什么工具?」

「你有什么工具?」

开发者Simon Willison随口一问,Meta的回复列出了16个工具。不是泄露,不是破解,是官方接口原封不动摆在那儿。Meta没宣传,没发博客,没放进发布会PPT。

这16个工具构成了一个完整的工作流系统。浏览器操作、代码执行、视觉分析、子代理调度,加上一个竞争对手无法复制的杀招:Instagram、Threads、Facebook的语义搜索。

Meta把社交图谱做成了工具层的护城河。

工具清单:从基础到离谱

工具清单:从基础到离谱

浏览器三件套最朴素:browser.search、browser.open、browser.find。搜索用的未公开引擎,能加载页面,能在内容里做模式匹配。没什么惊喜,但缺了它整个系统跑不起来。

meta_1p.content_search是Meta独占的狠活。语义搜索自家三大平台的内容,但有个硬性门槛——只搜2025年1月1日之后发布的,且用户必须有权限查看。参数设计得很细:author_ids限定作者,key_celebrities圈定名人,commented_by_user_ids和liked_by_user_ids能挖出特定用户的互动痕迹。

这不像搜索,像社交关系的数据库查询语言。

代码解释器走标准路线:container.python_execution跑Python 3.9,沙盒环境,预装pandas、numpy、matplotlib、plotly、scikit-learn、PyMuPDF、Pillow、OpenCV。文件丢在/mnt/data/目录下持久化。ChatGPT和Claude用户看着眼熟,这套模式已经成了行业共识。

Web artifacts工具能生成HTML+JavaScript文件,以沙盒iframe形式渲染。kind参数设成html就是小型应用,设成svg直接出矢量图。相当于在对话里搭了个前端预览环境。

visual_grounding是真正让同行坐不住的。

上传图片,它能识别物体,返回边界框坐标、关键点位置、数量统计。Meta把Segment Anything做成了可调用的工具——让它数浣熊的胡须,它给你每根的坐标。不是描述"图里有只浣熊",是精确到像素级的定位。

subagents.spawn_agent支持子代理派生。Simon Willison几个月前 documented 的代理协作模式,现在成了内置原语。主任务拆给子代理,各自跑完汇总结果。

行业收敛:大家殊途同归

行业收敛:大家殊途同归

Muse Spark模型本身中规中矩。Artificial Analysis打分52,排在Gemini 3.1 Pro、GPT-5.4、Claude Opus 4.6后面。Meta自称计算量比Llama 4 Maverick低一个数量级以上,但这话听听就好。

真正的故事是工具架构的趋同。每家大厂都在往同一个方向走:

文件操作原语(查看、插入、字符串替换),视觉分析绑定沙盒环境,代码执行作为标准配置。Meta的差异化在于社交图谱的深度集成——Claude和GPT拿不到的数据,它能调用

这是数据层面的不对称优势。不是模型更强,是工具能触达的上下文更丰富。

Scale AI的Alexandr Wang暗示过未来可能开源。Meta靠Llama系列开创了开源权重先例,Llama 4却转向封闭,现在Muse Spark又让人看到回转的迹象。

如果权重真的放出,这16个工具的工程实现就成了参考标准。开发者能在本地复刻meta.ai的完整体验,包括那个让竞争对手头疼的社交搜索。

但眼下全是租的。托管服务 only,私有API preview向特定用户开放。工具能用,但不属于你。

工具战争比模型战争更隐蔽

工具战争比模型战争更隐蔽

舆论盯着基准测试和参数规模,实际的生产力差距在工具层拉开。Code Interpreter + 视觉定位 + 子代理调度 + 社交图谱搜索,这组合已经不是聊天机器人,是完整的工作流引擎。

Meta选择不声张。可能是还没准备好规模化,可能是想保持竞争信息的模糊,也可能只是觉得普通用户不会关心技术细节。

但Simon Willison那个简单的问题——「你有什么工具?」——把窗户纸捅破了。16个工具摆在那里,等着被调用。

模型性能的差距在缩小。工具生态的差距还在扩大。当Claude和GPT的用户还在手动复制粘贴结果时,meta.ai的用户可能已经用子代理跑完了一整套数据分析流水线,顺便从三年前的Instagram帖子里挖出了关联信息。

这不是能力代差,是设计哲学的分野。Meta把AI当成操作系统的壳,竞争对手还在把它当成更聪明的搜索引擎。

下一步是什么?如果开源承诺兑现,这套工具架构会不会成为行业事实标准?如果继续保持封闭,社交图谱的独占性能撑多久护城河?

没人知道Meta的路线图。但那个问题已经问出去了——而且答案就躺在接口文档里,等着下一个Simon Willison去发现。