Meta Platforms(META.US)于周三发布了名为“Muse Spark”的大语言模型。这是该公司在经历Llama 4发布失利并对AI业务进行全面重整后,一年多来首次推出的重磅新款人工智能模型。

这款模型的发布正值Meta试图追赶OpenAI、Anthropic及Google DeepMind的关键时刻。《华尔街日报》指出,与此前坚持的开源策略不同,Muse Spark是一款闭源模型,将直接为Meta旗下的AI聊天机器人及内置AI功能提供支持。

基准测试:部分指标超越谷歌Gemini

Meta官方披露的内部基准测试数据显示,Muse Spark在部分测试中的得分已超越谷歌的Gemini,在另一些测试中则与OpenAI及Anthropic的顶级模型不相上下。在与xAI旗下模型Grok的对比中,Muse Spark在大多数测试里均实现大幅领先。

Meta特别提到,Muse Spark显著提升了Meta AI在回答健康相关问题方面的效率。独立初创公司Vals AI首席执行官雷恩·克里希南(Rayan Krishnan)在测试后表示,Meta从Llama 4到该模型实现了一次“质质的飞跃”,已成为具有竞争力的实验室。不过他也指出,该模型在编码能力方面仍表现不佳,预计将是未来的投入重点。

在分发模式上,Meta计划通过应用程序编程接口(API)向少数合作伙伴发布非公开预览版,并表示可能在晚些时候开源该模型的某些版本。

汪滔主理:140亿美元交易后的业务重塑

Muse Spark的发布被视为汪滔(Alexandr Wang)入主Meta AI业务后的重要成就。去年夏天,作为一项价值140亿美元交易的一部分,Meta首席执行官马克·扎克伯格(Mark Zuckerberg)聘请了这位Scale AI的前首席执行官负责监督新的AI业务。

汪滔的上任背景颇为曲折。在此之前,Meta曾陷入Llama 4发布表现失望、涉嫌操纵第三方基准测试以及大型模型“Behemoth”流产等负面漩涡。

为了重振技术前沿地位,扎克伯格组建了名为“Meta超级智能实验室(Meta Superintelligence Labs)”的新团队,成员约50人。据悉,扎克伯格曾向部分AI研究人员开出价值1亿美元的薪资待遇,并亲自进行拉拢。然而,新团队的涌入也引发了内部摩擦,导致部分早期AI员工流向竞争对手,或在去年10月的公司重组中被裁减。

财务表现与长远目标

受新模型发布消息提振,Meta股价周三收盘上涨6.5%。贝雅(Baird)高级研究分析师科林·塞巴斯蒂安(Colin Sebastian)认为,这是实现更好盈利能力和更高用户参与度的重要里程碑,接下来的挑战在于能否说服用户放弃ChatGPT和Gemini转而使用Meta AI。

扎克伯格在周三重申了公司的长期愿景:构建“超级智能”(superintelligence),即一种超越人类智能的技术,用以驱动能够为10多亿用户处理任务的个人智能体。他此前在1月的财报电话会议中曾预告,公司将通过持续发布新模型,在年内稳步推进技术前沿。

据汪滔在去年12月的内部问答中透露,其团队目前还有两款新模型处于开发阶段:

Avocado:代号为“牛油果”的基于文本的大语言模型;

Mango:代号为“芒果”的专注于图像和视频的模型。

Meta表示,未来将计划发布越来越先进的模型,包括新的开源模型,以持续推动智能能力的边界。