打开网易新闻 查看精彩图片
Meta今天突然开源了Muse Spark,一个号称能"实时生成"图像的新模型。发布会现场演示里,输入提示词后图像几乎是秒出——这速度把Stable Diffusion和Midjourney的用户看沉默了。
最尴尬的是Llama。这个被Meta押注了3年的大模型家族,原本承载着扎克伯格"开源AI基础设施"的野心,现在却在自家新品的对比下显得笨重又迟缓。有开发者在Hugging Face评论区直言:「Llama 4还没影,Meta先造了个图像生成器来抢风头。」
Muse Spark的技术路线也很扎心。它没走扩散模型的老路,而是用了自回归架构——换句话说,生成图像的方式更像GPT预测下一个token,而不是Stable Diffusion那种反复去噪的"打磨"过程。这让它在移动端跑起来格外轻快。
Meta AI负责人Ahmad Al-Dahle在Threads上回应质疑时只说了一句:"这是两个团队。"但没人买账。开源社区已经开始讨论:如果图像都能实时生成了,Llama的文本生成优势还能撑多久?
目前Muse Spark的权重已上传到Hugging Face,下载量3小时破万。一位刚跑完测试的工程师在Discord里发了张对比图:同样的"赛博朋克猫"提示词,Muse Spark用了0.8秒,SDXL用了12秒。他配的文案是:"Llama团队现在什么心情?"
热门跟贴