Meta憋了18个月的图像模型，把自家Llama架上火烤

Ping值焦虑

2026-04-10 10:51 ·北京

Meta今天突然开源了Muse Spark，一个号称能"实时生成"图像的新模型。发布会现场演示里，输入提示词后图像几乎是秒出——这速度把Stable Diffusion和Midjourney的用户看沉默了。

最尴尬的是Llama。这个被Meta押注了3年的大模型家族，原本承载着扎克伯格"开源AI基础设施"的野心，现在却在自家新品的对比下显得笨重又迟缓。有开发者在Hugging Face评论区直言：「Llama 4还没影，Meta先造了个图像生成器来抢风头。」

Muse Spark的技术路线也很扎心。它没走扩散模型的老路，而是用了自回归架构——换句话说，生成图像的方式更像GPT预测下一个token，而不是Stable Diffusion那种反复去噪的"打磨"过程。这让它在移动端跑起来格外轻快。

Meta AI负责人Ahmad Al-Dahle在Threads上回应质疑时只说了一句："这是两个团队。"但没人买账。开源社区已经开始讨论：如果图像都能实时生成了，Llama的文本生成优势还能撑多久？

目前Muse Spark的权重已上传到Hugging Face，下载量3小时破万。一位刚跑完测试的工程师在Discord里发了张对比图：同样的"赛博朋克猫"提示词，Muse Spark用了0.8秒，SDXL用了12秒。他配的文案是："Llama团队现在什么心情？"

打开网易新闻体验更佳

热搜

热门跟贴

打开APP发贴